逆写像定理をちゃんと振り返ろうとしたら、ついでに色々出てきてまとめる必要があるなと感じた。 記述は笠原皓司「微分積分学」を大幅に参考にしている。
準備
多変数関数の微分と偏微分
1変数関数のグラフは一般に曲線で、それに接線が引けるときに関数は微分可能と言った。2変数以上を持つ関数のグラフは一般に曲面になる。この関数が微分可能というときは、接平面が構築できれば良い。これを数学的にもう少し詳しく述べると次のようになる。
2変数関数 \(z = f(x, y)\) のグラフの一点 \(\ve{x}_{0} = (x_{0}, y_{0})\) における \(f({x}_{0}, y_{0})\) の接平面を考える。今、接平面ができたとしてその方程式を考えると、定数 \(\alpha, \beta\) を用いて
と表せる。点 \(\ve{x}_{0}\) とその近傍の点 \(\ve{x} = (x, y)\) において、この平面上の \(z\) の値と \(f(x, y)\) の誤差は、
となる。接平面であるときには、この誤差 \(g(x, y)\) が \(|\ve{x} - \ve{x}_{0}| = \sqrt{(x - x_{0})^{2} + (y - y_{0})^{2}}\) に対して無視できる程小さいことが必要である。即ち、
を満たせば良い。このとき、 \(f(x, y)\) は点 \(\ve{x}_{0}\) において微分可能という。
- 2変数関数の微分
\(z = f(x, y)\) が点 \(\ve{x}_{0} = (x_{0}, y_{0})\) で微分可能とは、ある定数 \(\alpha, \beta\) があって
\begin{equation*} \begin{cases} f(x, y) = f(x_{0}, y_{0}) + \alpha (x - x_{0}) + \beta (y - y_{0}) + g(x, y) \\ \displaystyle \lim_{\ve{x} \to \ve{x}_{0}} \frac{g(x, y)}{|\ve{x} - \ve{x}_{0}|} = 0 \quad (\ve{x} \neq \ve{x}_{0}) \end{cases} \end{equation*}と表せることである。
- 2変数関数の偏導関数
\(f(x, y)\) が \(\ve{x}_{0} = (x_{0}, y_{0})\) で微分可能なら、\(\alpha, \beta\) はそれぞれ以下の式で求まる。
\begin{align*} \alpha = \lim_{x \to x_{0}} \frac{f(x, y_{0}) - f(x_{0}, y_{0})}{x - x_{0}} \\ \beta = \lim_{y \to y_{0}} \frac{f(x_{0}, y) - f(x_{0}, y_{0})}{y - y_{0}} \end{align*}(証明)
\begin{equation*} \begin{cases} f(x, y) = f(x_{0}, y_{0}) + \alpha (x - x_{0}) + \beta (y - y_{0}) + g(x, y) \\ \displaystyle \lim_{\ve{x} \to \ve{x}_{0}} \frac{g(x, y)}{|\ve{x} - \ve{x}_{0}|} = 0 \quad (\ve{x} \neq \ve{x}_{0}) \end{cases} \end{equation*}だから、 \(y = y_{0}\) とすると、
\begin{equation*} f(x, y_{0}) = f(x_{0}, y_{0}) + \alpha (x - x_{0}) + g(x, y_{0}) \end{equation*}これは、\(y = y_{0}\) と固定したときに、 \(f(x, y_{0})\) が \(x\) で微分可能であることを示している。また、 \(\alpha\) について解くと、
\begin{align*} \alpha &= \frac{f(x, y_{0}) - f(x_{0}, y_{0})}{x - x_{0}} + \frac{g(x, y_{0})}{x - x_{0}} \\ \implies \lim_{x \to x_{0}} \alpha &= \alpha = \lim_{x \to x_{0}} \frac{f(x, y_{0}) - f(x_{0}, y_{0})}{x - x_{0}} \end{align*}\(\beta\) についても同様に \(x = x_{0}\) として求められる。(証明終)
この \(\alpha, \beta\) を偏微分係数といい、
と書く。2変数以上の場合も全く同様の考えにより微分が定義できる。冗長だが述べると、
- 多変数関数の微分
\(z = f(\ve{x}) = f(x_{1}, ..., x_{n})\) が点 \(\ve{x}_{0} = (x_{1}^{0}, ..., x_{n}^{0})\) で微分可能であるとは、ある定数 \(\alpha_{1}, ..., \alpha_{n}\) が存在して、
\begin{equation*} \begin{cases} \displaystyle f(\ve{x}) = f(\ve{x}_{0}) + \sum_{i = 1}^{n} \alpha_{i} (x_{i} - x_{i}^{0}) + g(\ve{x}) \\ \displaystyle \lim_{\ve{x} \to \ve{x}_{0}} \frac{g(\ve{x})}{|\ve{x} - \ve{x}_{0}|} = 0 \quad (\ve{x} \neq \ve{x}_{0}) \end{cases} \end{equation*}と表せることである。
- 多変数関数の偏導関数
\(f(\ve{x})\) が点 \(\ve{x}_{0}\) で微分可能なら、 \(\alpha_{i}\ (i = 1,...,n)\) はそれぞれ以下の式で求められる。
\begin{equation*} \alpha_{i} = \lim_{x_{i} \to x_{i}^{0}} \frac{f(x_{1}^{0}, ..., x_{i}, ..., x_{n}^{0}) - f(\ve{x}_{0})}{x_{i} - x_{i}^{0}} \end{equation*}(証明)微分可能性の定義式において \(x_{j} = x_{j}^{0}\ (j \neq i)\) とおくと、
\begin{align*} f(x_{1}^{0}, ..., x_{i}, ..., x_{n}^{0}) &= f(\ve{x}_{0}) + \alpha_{i}(x_{i} - x_{i}^{0}) + g(x_{1}^{0}, ..., x_{i}, ..., x_{n}^{0}) \\ \implies \alpha_{i} &= \frac{f(x_{1}^{0}, ..., x_{i}, ..., x_{n}^{0}) - f(\ve{x}_{0})}{x_{i} - x_{i}^{0}} + \frac{g(x_{1}^{0}, ..., x_{i}, ..., x_{n}^{0})}{x_{i} - x_{i}^{0}} \\ \implies \lim_{x_{i} \to x_{i}^{0}} \alpha_{i} = \alpha_{i} &= \lim_{x_{i} \to x_{i}^{0}} \frac{f(x_{1}^{0}, ..., x_{i}, ..., x_{n}^{0}) - f(\ve{x}_{0})}{x_{i} - x_{i}^{0}} \end{align*}(証明終)
やはり、この \(\alpha_{i}\ (i = 1,...,n)\) を偏微分係数と呼び、
と書く。
偏導関数の連続性による微分可能性の条件
\(f(x, y)\) が \(\ve{x}_{0} = (x_{0}, y_{0})\) において微分可能であれば、 \(x, y\) によって偏微分可能であるが、その逆(偏微分可能ならば微分可能)は成り立たない。しかし、以下の定理により、偏導関数に連続性を付与すれば、微分可能であることが示せる。
- 偏導関数の連続性による微分可能性の条件
\(f(x, y)\) が点 \(\ve{x}_{0} = (x_{0}, y_{0})\) で偏微分可能であり、かつ、\(x, y\) どちらかの偏導関数が \(\ve{x}_{0}\) で連続であるならば、 \(f(x, y)\) は \(\ve{x}_{0}\) で微分可能である。
(証明) \(\parfrac{f}{y}(x,y)\) が \(\ve{x}_{0}\) の近傍で存在し、かつ \(\ve{x}_{0}\) で連続と仮定して証明する( \(\parfrac{f}{x}\) が \(\ve{x}_{0}\) で連続としても同様に示せる)。 \(f\) は \(x\) について偏微分可能だから、
\begin{align*} \parfrac{f}{x}(x_{0}, y_{0}) &= \frac{f(x, y_{0}) - f(x_{0}, y_{0})}{x - x_{0}} + \frac{g(x)}{x - x_{0}} \\ \implies f(x, y_{0}) &= f(x_{0}, y_{0}) + \parfrac{f}{x}(x_{0}, y_{0})(x - x_{0}) + g(x) \tag{1} \\ \lim_{x \to x_{0}} \frac{g(x)}{x - x_{0}} &= 0 \end{align*}なる \(g(x)\) が存在する。一方、 \(\ve{x}_{0}\) の近傍で \(f\) は \(y\) について偏微分可能だから、平均(中間)値の定理により、
\begin{equation*} f(x, y) - f(x, y_{0}) = \parfrac{f}{y}(x, \eta)(y - y_{0}) \end{equation*}を満たす \(\eta\) が \(y_{0}\) と \(y\) の間に存在する。上式を(1)に代入すると、
\begin{align*} f(x, y) &= f(x_{0}, y_{0}) + \parfrac{f}{x}(x_{0}, y_{0})(x - x_{0}) + \parfrac{f}{y}(x, \eta)(y - y_{0}) + g(x) \\ &= f(x_{0}, y_{0}) + \parfrac{f}{x}(x_{0}, y_{0})(x - x_{0}) + \parfrac{f}{y}(x_{0}, y_{0})(y - y_{0}) + \left\{ \parfrac{f}{y}(x, \eta) - \parfrac{f}{y}(x_{0}, y_{0}) \right\} (y - y_{0}) + g(x) \\ &= f(x_{0}, y_{0}) + \parfrac{f}{x}(x_{0}, y_{0})(x - x_{0}) + \parfrac{f}{y}(x_{0}, y_{0})(y - y_{0}) + h(x, y) \end{align*}ここで、
\begin{equation*} h(x, y) = \left\{ \parfrac{f}{y}(x, \eta) - \parfrac{f}{y}(x_{0}, y_{0}) \right\} (y - y_{0}) + g(x) \end{equation*}とおいている。そして \(h(x, y)\) は、
\begin{equation*} \frac{h(x, y)}{|\ve{x} - \ve{x}_{0}|} = \left\{ \parfrac{f}{y}(x, \eta) - \parfrac{f}{y}(x_{0}, y_{0}) \right\} \frac{y - y_{0}}{|\ve{x} - \ve{x}_{0}|} + \frac{x - x_{0}}{|\ve{x} - \ve{x}_{0}|} \frac{g(x)}{x - x_{0}} \end{equation*}と変形でき、 \(|\ve{x} - \ve{x}_{0}| = \sqrt{(x - x_{0})^{2} + (y - y_{0})^{2}}\) より \(\frac{y - y_{0}}{|\ve{x} - \ve{x}_{0}|} \leq \frac{|y - y_{0}|}{|\ve{x} - \ve{x}_{0}|} \leq 1\) と \(\frac{x - x_{0}}{|\ve{x} - \ve{x}_{0}|} \leq \frac{|x - x_{0}|}{|\ve{x} - \ve{x}_{0}|} \leq 1\) が成り立つ。また、 \(\ve{x} \to \ve{x}_{0}\) のとき \((x, \eta) \to (x_{0}, y_{0})\) となるが、仮定より \(\parfrac{f}{y}(x, y)\) は \(\ve{x}_{0}\) で連続だから、 \(\parfrac{f}{y}(x, \eta) - \parfrac{f}{y}(x_{0}, y_{0}) \to 0\) となる。従って、
\begin{equation*} \lim_{\ve{x} \to \ve{x}_{0}} \frac{h(x, y)}{|\ve{x} - \ve{x}_{0}|} = 0 \end{equation*}これは \(f(x, y)\) が \(\ve{x}_{0}\) で微分可能であることを示している。(証明終)
上記は最も単純な2変数の場合の証明だが、一般の多変数においても同様の定理が成り立つ。
- 偏導関数の連続性による微分可能性の条件(多変数)
\(\ve{x} = (x_{1}, ..., x_{p}),\ \ve{y} = (y_{1}, ..., y_{n})\) とするとき、\(p + n\) 変数の関数 \(f(\ve{X}) = f(\ve{x}, \ve{y}) = f(x_{1}, ..., x_{p}, y_{1}, ..., y_{n})\) が点 \(\ve{X}_{0} = (\ve{x}_{0}, \ve{y}_{0}) = (x_{1}^{0}, ..., x_{p}^{0}, y_{1}^{0}, ..., y_{n}^{0})\) で \(\ve{x}\) に関して微分可能であり、かつ \(\ve{y}\) に関する偏導関数が \(\ve{X}_{0}\) の近傍で存在し、しかも偏導関数が \(\ve{X}_{0}\) で連続ならば、 \(f(\ve{x}, \ve{y})\) は \((\ve{x}_{0}, \ve{y}_{0})\) で微分可能である。
(証明)2変数の場合とほぼ同様。 \(f\) は \(\ve{x}\) について微分可能だから、
\begin{equation*} \begin{cases} \displaystyle f(\ve{x}, \ve{y}_{0}) = f(\ve{x}_{0}, \ve{y}_{0}) + \sum_{i = 1}^{p} \parfrac{f}{x_{i}}(\ve{x}_{0}, \ve{y}_{0})(x_{i} - x_{i}^{0}) + g(\ve{x}) \tag{2} \\ \displaystyle \lim_{\ve{x} \to \ve{x}_{0}} \frac{g(\ve{x})}{|\ve{x} - \ve{x}_{0}|} = 0 \end{cases} \end{equation*}一方、 \((\ve{x}_{0}, \ve{y}_{0})\) において、 \(f\) は \(\ve{y}\) について偏微分可能だから、平均値の定理より
\begin{equation*} f(\ve{x}, \ve{y}) - f(\ve{x}, \ve{y}_{0}) = \sum_{i = 0}^{n} \parfrac{f}{y_{i}} (\ve{x}, \ve{\eta}) (y_{i} - y_{i}^{0}) \end{equation*}を満たす \(\ve{\eta}\) が \(\ve{y}_{0}\) と \(\ve{y}\) の間に存在する。(2)へ代入すると、
\begin{align*} f(\ve{x}, \ve{y}) &= f(\ve{x}_{0}, \ve{y}_{0}) + \sum_{i = 1}^{p} \parfrac{f}{x_{i}}(\ve{x}_{0}, \ve{y}_{0})(x_{i} - x_{i}^{0}) + \sum_{i = 1}^{n} \parfrac{f}{y_{i}}(\ve{x}, \ve{\eta})(y_{i} - y_{i}^{0}) + g(\ve{x}) \\ &= f(\ve{x}_{0}, \ve{y}_{0}) + \sum_{i = 1}^{p} \parfrac{f}{x_{i}}(\ve{x}_{0}, \ve{y}_{0})(x_{i} - x_{i}^{0}) + \sum_{i = 1}^{n} \parfrac{f}{y_{i}}(\ve{x}_{0}, \ve{y}_{0})(y_{i} - y_{i}^{0}) + \sum_{i = 1}^{n} \left\{ \parfrac{f}{y_{i}}(\ve{x}, \ve{\eta}) - \parfrac{f}{y_{i}}(\ve{x}_{0}, \ve{y}_{0}) \right\}(y_{i} - y_{i}^{0}) + g(\ve{x}) \\ &= f(\ve{x}_{0}, \ve{y}_{0}) + \sum_{i = 1}^{p} \parfrac{f}{x_{i}}(\ve{x}_{0}, \ve{y}_{0})(x_{i} - x_{i}^{0}) + \sum_{i = 1}^{n} \parfrac{f}{y_{i}}(\ve{x}_{0}, \ve{y}_{0})(y_{i} - y_{i}^{0}) + h(\ve{x}, \ve{y}) \end{align*}\(h(\ve{x}, \ve{y})\) を \(|\ve{X} - \ve{X}_{0}| = \sqrt{ \sum_{i = 1}^{p} (x_{i} - x_{i}^{0})^{2} + \sum_{i = 1}^{n} (y_{i} - y_{i}^{0})^{2} }\) で割ると、
\begin{equation*} \frac{h(\ve{x}, \ve{y})}{|\ve{X} - \ve{X}_{0}|} = \sum_{i = 1}^{n} \left\{ \parfrac{f}{y_{i}}(\ve{x}, \ve{\eta}) - \parfrac{f}{y_{i}}(\ve{x}_{0}, \ve{y}_{0}) \right\} \frac{y_{i} - y_{i}^{0}}{|\ve{X} - \ve{X}_{0}|} + \frac{|\ve{x} - \ve{x}_{0}|}{|\ve{X} - \ve{X}_{0}|}\frac{g(\ve{x})}{|\ve{x} - \ve{x}_{0}|} \end{equation*}となる。やはり \(\ve{X} \to \ve{X}_{0}\) のとき \(\lim_{\ve{X} \to \ve{X}_{0}} \frac{h(\ve{x}, \ve{y})}{|\ve{X} - \ve{X}_{0}|} = 0\) だから、 \(f\) は \((\ve{x}_{0}, \ve{y}_{0})\) において微分可能である。(証明終)
写像の微分と偏微分
\(\mathbb{R}^{n}\) の領域 \(\Omega\) から \(\mathbb{R}^{m}\) への写像 \(\ve{f}\) を考える。 \(\ve{x} = [x_{1}, ..., x_{n}]^{\mathsf{T}} \in \Omega\) に対して \(\ve{f}(\ve{x}) = [ f_{1}(\ve{x}), ..., f_{m}(\ve{x}) ]^{\mathsf{T}} \in \mathbb{R}^{m}\) と書けるから、 \(f_{1}(\ve{x}), ..., f_{m}(\ve{x})\) が \(\ve{x}_{0} = [ x_{1}^{0}, ..., x_{n}^{0} ]^{\mathsf{T}}\) で連続な時、
が成り立つ。ここで、次の ヤコビ行列(関数行列)
を使えば、次のようにまとめられる。
ここで、 \(\ve{g}(\ve{x}) = [ g_{1}(\ve{x}), ..., g_{m}(\ve{x}) ]^{\mathsf{T}}\) である。そして行列 \(\ve{M}(\ve{x}_{0})\) が存在するとき、写像 \(\ve{f}\) は \(\ve{x}_{0}\) で微分可能であるという。
- 写像の微分可能性の必要十分条件
写像 \(\ve{f}\) が \(\ve{x}_{0}\) で微分可能であるための必要十分条件は、 \(\ve{x}_{0}\) の近傍で定義され、かつ \(\ve{x}_{0}\) で連続な関数を要素とする行列 \(\ve{M}(\ve{x})\) があって、
\begin{equation*} \ve{f}(\ve{x}) = \ve{f}(\ve{x}_{0}) + \ve{M}(\ve{x})(\ve{x} - \ve{x}_{0}) \tag{3} \end{equation*}を満たすことである。また、このとき \(\parfrac{\ve{f}}{\ve{x}}(\ve{x}_{0}) = \ve{M}(\ve{x}_{0})\) 。
( \(\Rightarrow\) の証明) \(\ve{f}\) が \(\ve{x}_{0}\) で微分可能とする。
\begin{align*} \ve{f}(\ve{x}) &= \ve{f}(\ve{x}_{0}) + \parfrac{\ve{f}}{\ve{x}}(\ve{x}_{0})(\ve{x} - \ve{x}_{0}) + \ve{g}(\ve{x}) \\ &= \ve{f}(\ve{x}_{0}) + \left\{ \parfrac{\ve{f}}{\ve{x}}(\ve{x}_{0}) + \frac{\ve{g}(\ve{x})}{|\ve{x} - \ve{x}_{0}|^{2}} (\ve{x} - \ve{x}_{0})^{\mathsf{T}} \right\} (\ve{x} - \ve{x}_{0}) \end{align*}の観察から、
\begin{equation*} \ve{M}(\ve{x}) = \left\{ \begin{array}{ll} \parfrac{\ve{f}}{\ve{x}}(\ve{x}_{0}) + \frac{\ve{g}(\ve{x})}{|\ve{x} - \ve{x}_{0}|^{2}} (\ve{x} - \ve{x}_{0})^{\mathsf{T}} & (\ve{x} \neq \ve{x}_{0}) \\ \parfrac{\ve{f}}{\ve{x}}(\ve{x}_{0}) & (\ve{x} = \ve{x}_{0}) \end{array} \right. \end{equation*}とおけば、この \(\ve{M}(\ve{x})\) は \(\ve{x}_{0}\) で連続であり、(3) 式が得られることがわかる。( \(\Rightarrow\) の証明終)
( \(\Leftarrow\) の証明) (3) 式から、
\begin{align*} \ve{f}(\ve{x}) &= \ve{f}(\ve{x}_{0}) + \ve{M}(\ve{x})(\ve{x} - \ve{x}_{0}) \\ &= \ve{f}(\ve{x}_{0}) + \ve{M}(\ve{x}_{0})(\ve{x} - \ve{x}_{0}) + \left\{ \ve{M}(\ve{x}) - \ve{M}(\ve{x}_{0}) \right\} (\ve{x} - \ve{x}_{0}) \end{align*}となり、今、
\begin{equation*} \ve{g}(\ve{x}) = \left\{ \ve{M}(\ve{x}) - \ve{M}(\ve{x}_{0}) \right\} (\ve{x} - \ve{x}_{0}) \end{equation*}とおくと、 \(\ve{M}(\ve{x})\) の \(\ve{x}_{0}\) における連続性から \(\frac{|\ve{g}(\ve{x})|}{|\ve{x} - \ve{x}_{0}|} = |\ve{M}(\ve{x}) - \ve{M}(\ve{x}_{0})| \to 0\ (\ve{x} \to \ve{x}_{0})\) より \(\lim_{\ve{x} \to \ve{x}_{0}} \frac{\ve{g}(\ve{x})}{|\ve{x} - \ve{x}_{0}|} = \ve{0}\) が成立する。よって \(\ve{f}\) は \(\ve{x}_{0}\) において微分可能。( \(\Leftarrow\) の証明終)
上記の必要十分条件を用いることで、合成写像に対する微分公式が簡単に得られる。
- 合成写像の微分
\(\ve{y} = \ve{f}(\ve{x})\) は \(\mathbb{R}^{n}\) から \(\mathbb{R}^{m}\) への写像、 \(\ve{z} = \ve{g}(\ve{y})\) は \(\mathbb{R}^{m}\) から \(\mathbb{R}^{l}\) への写像で、 \(\ve{f}\) が \(\ve{x}_{0}\) で、 \(\ve{g}\) が \(\ve{y}_{0} = \ve{f}(\ve{x}_{0})\) でそれぞれ微分可能なら、 \(\ve{g}(\ve{f}(\ve{x}))\) は \(\ve{x}_{0}\) で微分可能で、
\begin{equation*} \parfrac{\ve{z}}{\ve{x}}(\ve{x}_{0}) = \parfrac{\ve{z}}{\ve{y}} (\ve{y}_{0}) \parfrac{\ve{y}}{\ve{x}}(\ve{x}_{0}) \end{equation*}(証明)
\begin{equation*} \begin{cases} \ve{f}(\ve{x}) = \ve{f}(\ve{x}_{0}) + \ve{M}(\ve{x})(\ve{x} - \ve{x}_{0}) \\ \ve{g}(\ve{y}) = \ve{g}(\ve{y}_{0}) + \ve{N}(\ve{y})(\ve{y} - \ve{y}_{0}) \end{cases} \end{equation*}と書けるから、
\begin{align*} \ve{z} = \ve{g}(\ve{f}(\ve{x})) &= \ve{g}(\ve{f}(\ve{x}_{0}) + \ve{M}(\ve{x})(\ve{x} - \ve{x}_{0})) \\ &= \ve{g}(\ve{y}_{0}) + \ve{N}(\ve{f}(\ve{x})) \left\{ \ve{f}(\ve{x}_{0}) + \ve{M}(\ve{x})(\ve{x} - \ve{x}_{0}) - \ve{y}_{0} \right\} \\ &= \ve{g}(\ve{y}_{0}) + \ve{N}(\ve{f}(\ve{x})) \ve{M}(\ve{x})(\ve{x} - \ve{x}_{0}) \end{align*}ここで \(\ve{N}(\ve{f}(\ve{x}))\ve{M}(\ve{x})\) は \(\ve{x}_{0}\) で連続だから、 \(\ve{g}(\ve{f}(\ve{x}))\) は \(\ve{x}_{0}\) で微分可能で、
\begin{equation*} \parfrac{\ve{z}}{\ve{x}}(\ve{x}_{0}) = \ve{N}(\ve{f}(\ve{x}_{0})) \ve{M}(\ve{x}_{0}) = \parfrac{\ve{z}}{\ve{y}}(\ve{y}_{0}) \parfrac{\ve{y}}{\ve{x}}(\ve{x}_{0}) \end{equation*}(証明終)
積分公式
平均値の定理を応用した便利な公式。以下の証明で頻繁に使用するため証明を与える。
- 積分公式
\(\ve{f}\) を \(\mathbb{R}^{n}\) の領域 \(\Omega\) から \(\mathbb{R}^{n}\) への \(C^{1}\) 級写像とする。 \(\ve{x}_{0}, \ve{x} \in \Omega\) とこの2点を結ぶ線分が \(\Omega\) に属するとき、
\begin{equation*} \ve{f}(\ve{x}) - \ve{f}(\ve{x}_{0}) = \left\{ \int_{0}^{1} \parfrac{\ve{f}}{\ve{x}} (\ve{x}_{0} + t (\ve{x} - \ve{x}_{0})) \mathrm{d}t \right\} (\ve{x} - \ve{x}_{0}) \end{equation*}ここで、 \(\{ \}\) の中身は \(n \times n\) の行列になっていることに注意。
(証明) \(\ve{\varphi}(t) = \ve{f}(\ve{x}_{0} + t (\ve{x} - \ve{x}_{0}))\) とおくと、
\begin{align*} \ve{f}(\ve{x}) - \ve{f}(\ve{x}_{0}) &= \ve{\varphi}(1) - \ve{\varphi}(0) = \int_{0}^{1} \dfrac{\ve{\varphi}(t)}{t} \mathrm{d}t \\ &= \int_{0}^{1} \parfrac{\ve{f}}{\ve{x}} (\ve{x}_{0} + t (\ve{x} - \ve{x}_{0})) \dfrac{}{t} \left\{ \ve{x}_{0} + t (\ve{x} - \ve{x}_{0}) \right\} \mathrm{d}t \quad (\because \text{合成関数の微分}) \\ &= \int_{0}^{1} \parfrac{\ve{f}}{\ve{x}} (\ve{x}_{0} + t (\ve{x} - \ve{x}_{0})) (\ve{x} - \ve{x}_{0}) \mathrm{d}t \\ &= \left\{ \int_{0}^{1} \parfrac{\ve{f}}{\ve{x}} (\ve{x}_{0} + t (\ve{x} - \ve{x}_{0})) \mathrm{d}t \right\} (\ve{x} - \ve{x}_{0}) \end{align*}(証明終)
連続関数の集合の完備性
かなり基礎的だが、以下の証明に必要なため書く。区間 \(I\) で連続な関数の集合を \(C^{0}(I)\) と書く。 \(f \in C^{0}(I)\) に対して、関数の "大きさ" を次のノルムとして定義する。
- 関数のノルム
- \(|| f ||_{0} = \sup_{x \in I} |f(x)|\) を関数 \(f\) のノルムという。
ノルムは一般に次の3つの満たしている。
- \(|| f ||_{0} \geq 0\) (等号成立は \(f(x) = 0\ (x \in I)\) に限る)
- \(|| \lambda f ||_{0} = |\lambda| || f ||_{0}\) ( \(\lambda\) は定数)
- \(|| f + g ||_{0} \leq || f ||_{0} + || g ||_{0}\) ( 三角不等式 と呼ぶ)
関数のノルムにより、\(C^{0}(I)\) 上の関数列 \(\{ f_{n}(x) \}\) が \(I\) において \(f(x)\) に一様収束することを
と表せる。
次に、連続関数のノルムについて一様収束列とコーシー列が同値であることを見ていく。
- 連続関数の一様収束列とコーシー列
\(C^{0}(I)\) の関数列 \(\{ f_{n}(x) \}\) が一様収束列であるための必要十分条件は、 \(\{ f_{n}(x) \}\) がノルムに関してコーシー列であることである。ここで、ノルムに関するコーシー列とは、任意の \(\varepsilon > 0\) に対して自然数 \(N\) を適当に選べば、 \(p, q \geq N\) に対して、
\begin{equation*} || f_{p} - f_{q} ||_{0} < \varepsilon \end{equation*}が成立することを言う。
( \(\Rightarrow\) の証明) \(\{ f_{n}(x) \}\) が \(f \in C^{0}(I)\) に一様収束すれば、任意の \(\varepsilon > 0\) に対して自然数 \(N\) を適当に大きく選んで \(|| f_{n} - f ||_{0} < \varepsilon / 2\ (n \geq N)\) とできるから、 \(p, q \geq N\) なる \(p, q\) について
\begin{align*} || f_{p} - f_{q} ||_{0} &= || f_{p} - f - ( f_{q} - f ) ||_{0} \\ &\leq || f_{p} - f ||_{0} + || -( f_{q} - f ) ||_{0} \quad (\because \text{三角不等式}) \\ &= || f_{p} - f ||_{0} + || f_{q} - f ||_{0} \\ &< \frac{\varepsilon}{2} + \frac{\varepsilon}{2} = \varepsilon \end{align*}これは \(\{ f_{n}(x) \}\) がコーシー列をなしていることを示している。( \(\Rightarrow\) の証明終)
( \(\Leftarrow\) の証明) コーシー列は収束列(本稿では省略!!)だから、極限値があり、それを \(f\) とおく。任意の \(\varepsilon > 0\) に対して、自然数 \(N\) を適当に大きく選び、
\begin{equation*} |f_{p}(x) - f_{q}(x)| \leq || f_{p} - f_{q} ||_{0} < \varepsilon \quad (p,q \geq N, \ x \in I) \end{equation*}とできる。ここで、 \(q \to \infty\) とすると、 \(\lim_{q \to \infty} f_{q}(x) = f(x)\) だから、
\begin{equation*} |f_{p}(x) - f(x)| \leq || f_{p} - f || < \varepsilon \quad (p \geq N) \end{equation*}となる。これは、 \(\{ f_{n}(x) \}\) が \(f(x)\) への一様収束列であることを示している。 最後に \(f \in C^{0}(I)\)、即ち \(f\) が \(I\) で連続であることを示す。任意の点 \(x_{0} \in I\) に対して、収束列の元 \(f_{n}\) を使うと、
\begin{align*} |f(x) - f(x_{0})| &= |f(x) - f_{n}(x) + f_{n}(x) - f_{n}(x_{0}) + f_{n}(x_{0}) - f(x_{0}) | \\ &\leq |f(x) - f_{n}(x)| + |f_{n}(x) - f_{n}(x_{0})| + |f_{n}(x_{0}) - f(x)| \\ &\leq || f_{n} - f ||_{0} + |f_{n}(x) - f_{n}(x_{0})| + || f_{n} - f ||_{0} \end{align*}まず、 \(\{ f_{n}(x) \}\) の一様収束性により、任意の \(\varepsilon > 0\) に対して \(n\) を十分大きく取れば \(|| f_{n} - f ||_{0} < \varepsilon / 3\) とできる。また、 \(f_{n}\) は \(I\) で連続だから、ある \(\delta > 0\) があって \(|f_{n}(x) - f_{n}(x_{0})| < \varepsilon / 3\ (|x - x_{0}| < \delta)\) とできる。まとめると、任意の \(\varepsilon > 0\) と \(x_{0} \in I\) に対して、 ある \(\delta > 0\) があって、任意の \(x \in I\) で
\begin{equation*} |f(x) - f(x_{0})| < \frac{\varepsilon}{3} + \frac{\varepsilon}{3} + \frac{\varepsilon}{3} = \varepsilon \quad (|x - x_{0}| < \delta) \end{equation*}が成立している。これは、 \(f(x)\) が \(I\) で連続であることを示しており、 \(f \in C^{0}(I)\) が言える。( \(\Leftarrow\) の証明終)
一般に、コーシー列が必ず収束列になるとき、その集合を 完備 であるという。直感的には、集合上にコーシー列を構成したときに、極限値がその集合から飛び出ることがないことを指す。 \(C^{0}(I)\) はノルムに関して完備な集合である。
不動点定理
本稿では(「微分積分学」を参考に)陰関数の存在を示すために不動点定理を使用する。本節では不動点定理について説明する。
- 縮小写像
関数集合 \(\mathcal{F}\) から \(\mathcal{F}\) への写像 \(\Phi(f)\) がノルム \(||f||_{0} = \sup_{\ve{x}} |f(\ve{x})|\) に関して 縮小写像 であるとは、ある定数 \(\rho \in [0, 1)\) があって、
\begin{equation*} ||\Phi(f) - \Phi(g)||_{0} \leq \rho ||f - g||_{0} \end{equation*}が任意の \(f, g \in \mathcal{F}\) について成立することを言う。
縮小写像 \(\Phi\) によって写像した関数間の距離は、写像する前よりも小さくなることを言っている。この縮小写像を繰り返し適用することで、ある関数(極限関数)に一様収束するとき、それを不動点という。定理の形で述べると次のようになる。
- 不動点定理
\(\Phi(f)\) を \(\mathcal{F}\) から \(\mathcal{F}\) への縮小写像とし、 \(\mathcal{F}\) は \(C^{0}(\Omega)\) (定義域 \(\Omega\) の \(C^{0}\) 級すなわち連続関数の集合)において完備な集合とする。このとき、
\begin{equation*} f = \Phi(f) \end{equation*}を満たす関数 \(f \in \mathcal{F}\) が唯一つ存在する。この様な \(f\) を \(\mathcal{F}\) における \(\Phi\) の不動点という。
(証明) \(f_{0} \in \mathcal{F}\) を任意に一つ取って、
\begin{equation*} f_{n} = \Phi(f_{n-1}) \quad n = 1, 2, ... \end{equation*}によって関数列 \(\{ f_{n} \}\) を作り、これがノルム \(||\cdot||_{0}\) に関してコーシー列を作っていることを確かめる。 \(\Phi\) は縮小写像だから、
\begin{align*} || f_{n + 1} - f_{n} ||_{0} &= || \Phi(f_{n}) - \Phi(f_{n-1}) ||_{0} \\ &\leq \rho || f_{n} - f_{n-1} ||_{0} = \rho || \Phi(f_{n-1}) - \Phi(f_{n-2}) ||_{0} \\ &\leq \rho^{2} || f_{n-1} - f_{n-2} ||_{0} = \rho^{2} || \Phi(f_{n-2}) - \Phi(f_{n-1}) ||_{0} \\ &\vdots \\ &\leq \rho^{n} || f_{1} - f_{0} ||_{0} \end{align*}従って、\(p \leq q\) を満たす任意の添字について、
\begin{align*} || f_{p} - f_{q} ||_{0} &= || f_{p} - f_{p+1} + f_{p+1} - f_{p+2} + f_{p+2} + ... + f_{q-1} + f_{q} ||_{0} \\ &\leq || f_{p} - f_{p+1} ||_{0} + || f_{p+1} - f_{p+2} ||_{0} + ... + || f_{q-1} + f_{q} ||_{0} \quad (\because \text{三角不等式}) \\ &\leq \rho^{p} || f_{1} - f_{0} ||_{0} + \rho^{p+1} || f_{1} - f_{0} ||_{0} + ... + \rho^{q-1} || f_{1} - f_{0} ||_{0} \\ &= \rho^{p}(1 + \rho + ... + \rho^{q-1-p}) || f_{1} - f_{0} ||_{0} \\ &= \frac{\rho^{p}(1 - \rho^{q-1-p})}{1 - \rho} || f_{1} - f_{0} ||_{0} \quad (\because \text{等比級数の和の公式}) \\ &\leq \frac{\rho^{p}}{1 - \rho} || f_{1} - f_{0} ||_{0} \end{align*}最後の式は \(p\) を大きくしていくといくらでも小さくなる。従って、 \(\{ f_{n} \}\) はコーシー列である。更に、 \(\mathcal{F}\) は完備な集合だから \(\{ f_{n} \}\) は収束列であり、ある \(f \in \mathcal{F}\) があって、 \(f_{n}\) は 領域 \(\Omega\) において \(f\) に一様収束する( \(\because\) コーシーの収束定理)。 従って、 \(f_{n} = \Phi(f_{n-1})\) の \(n\) を大きくしていくと、極限において
\begin{equation*} f = \Phi(f) \end{equation*}が成立する。従って、 \(f\) は \(\Phi\) の不動点である。 次に唯一性を示す。仮に不動点が2つあったとして、それらを \(f, g\) を書くと、
\begin{equation*} || f - g ||_{0} = || \Phi(f) - \Phi(g) ||_{0} \leq \rho || f - g ||_{0} < || f - g ||_{0} \end{equation*}となるが、これは \(|| f - g ||_{0} > 0\) である限り \(|| f - g ||_{0} < || f - g ||_{0}\) となって矛盾。従って \(|| f - g ||_{0} = 0\) でなければならず、これは \(f\) と \(g\) が同一の不動点であることを意味する。(証明終)
陰関数定理
まずは2変数 \(x, y\) で考えてみる。 \(x^{2} + y^{2} - 2 = 0\) のように \(y = f(x)\) が陽に分からない場合がある。この2変数関数 \(F(x, y)\) による等式 \(F(x, y) = 0\) を陰関数表示という。 \(F(x, y) = 0\) に対して、何らかの関数 \(y = f(x)\) (もしくは \(x = h(y)\) )の存在を保証するのが陰関数定理である。
- 陰関数定理(2変数)
\(\mathbb{R}^{2}\) のある領域(開部分集合) \(\Omega\) で \(F(x, y)\) は連続とし、 \(\Omega\) の1点 \((x_{0}, y_{0})\) の近傍 \(U\) で \(y\) について偏微分可能かつ \(F_{y}(x, y) = \parfrac{F}{y}(x, y)\) は \(U\) で連続とする。このとき、次の 1 - 4 が成り立つ。
- もし、 \(F(x_{0}, y_{0}) = 0,\ F_{y}(x_{0}, y_{0}) \neq 0\) ならば、 \((x_{0}, y_{0})\) の十分小さい近傍 \(V\) において
\begin{equation*} y_{0} = f(x_{0}), \ F(x, f(x)) = 0 \end{equation*}を満たす連続関数 \(y = f(x)\ ((x, y) \in V)\) が唯一つ存在する。( \(x\) と \(y\) の関係を入れ替えても成立する。即ち \(F(x_{0}, y_{0}) = 0,\ F_{x}(x_{0}, y_{0}) \neq 0\) ならば、 \((x_{0}, y_{0})\) の近傍で \(x_{0} = h(y_{0}), \ F(h(y), y) = 0\) を満たす連続関数 \(h\) が存在する)。
- 1が成り立つとき、 \(F\) が \((x_{0}, y_{0})\) において \(x\) について偏微分可能なら、 \(f(x)\) は \(x_{0}\) において微分可能で、
\begin{equation*} \dfrac{f}{x}(x_{0}) = - \frac{F_{x}(x_{0}, y_{0})}{F_{y}(x_{0}, y_{0})} \end{equation*}- 2が成り立つとき、 \(F\) が \(U\) 上で \(C^{1}\) 級なら、 \(f(x)\) も \(C^{1}\) 級で、
\begin{equation*} \dfrac{f}{x}(x) = - \frac{F_{x}(x, y)}{F_{y}(x, y)} \quad (x, f(x)) \in V \end{equation*}- 3が成り立つとき、 \(F\) が \(U\) 上で \(C^{m}\) 級なら、 \(f(x)\) も \(C^{m}\) 級。
(1.の証明) \(x_{0}\) の近傍 \(U_{1}\) と \(y_{0}\) の近傍 \(U_{2}\) を適当に選んで \(U_{1} \times U_{2} \subset U\) となるようにしておく。 \(M = F_{y}(x_{0}, y_{0})\) とおく。 \(F_{y}\) は仮定より連続だから、 \(\rho \in (0, 1)\) なる \(\rho\) を1つ取り、これに応じて \(U_{1}, U_{2}\) を小さく取り直して
\begin{equation*} |M - F_{y}(x, y)| < \rho |M| \quad (x \in U_{1}, y \in U_{2}) \end{equation*}とできる。更に、 \(F\) は連続だから、 \(U_{2} = [ y_{0} - \delta, y_{0} + \delta ]\) と閉区間を取ったとき、 \(\delta\) に応じて \(U_{1}\) を小さく取り直し、
\begin{equation*} |F(x, y_{0}) - F(x_{0}, y_{0})| = |F(x, y_{0})| < (1 - \rho)|M|\delta \quad (x \in U_{1}) \end{equation*}とできる。次に、関数の集合 \(\mathcal{F}\) として、 \(U_{1}\) 上で連続で、 \(y_{0} = \varphi(x_{0})\) となり、かつ \(x \in U_{1}\) において \(\varphi(x) \in U_{2}\) となるような関数 \(\varphi\) の全体をとる。 \(U_{1}\) 上で連続な関数の集合を \(C^{0}(U_{1})\) とかくと、\(\mathcal{F} \subset C^{0}(U_{1})\) が成立する。今、写像 \(\Phi(\varphi)\) として、
\begin{equation*} \Phi(\varphi)(x) = \varphi(x) - \frac{1}{M} F(x, \varphi(x)) \end{equation*}とおいた時、これが \(\mathcal{F}\) から \(\mathcal{F}\) への縮小写像であって、かつ \(\mathcal{F}\) が完備であることを示す。まず、 \(\varphi \in \mathcal{F}\) を任意に取ったときに、 \(\Phi(\varphi) \in \mathcal{F}\) となることを示す。平均値の定理により、 \(\varphi(x)\) と \(y_{0}\) の間に \(\xi_{1}(x)\) を適当に選び、
\begin{equation*} F(x, \varphi(x)) = F(x, y_{0}) + F_{y}(x, \xi_{1}(x))(\varphi(x) - y_{0}) \end{equation*}とできるから、
\begin{align*} |\Phi(\varphi)(x) - y_{0}| &= |\varphi(x) - \frac{1}{M}F(x, \varphi(x)) - y_{0}| \\ &= |\varphi(x) - y_{0} - \frac{1}{M}F(x, y_{0}) - \frac{1}{M}F(x, \xi_{1}(x))(\varphi(x) - y_{0})| \\ &= \left| \left\{ \varphi(x) - y_{0} \right\} \left\{ 1 - \frac{1}{M}F(x, \xi_{1}(x)) \right\} - \frac{1}{M}F(x, \varphi(x)) \right| \\ &\leq |\varphi(x) - y_{0}|\left| 1 - \frac{1}{M}F(x, \xi_{1}(x)) \right| + \left| \frac{1}{M}F(x, \varphi(x)) \right| \quad (\because \text{三角不等式}) \\ &< \rho |\varphi(x) - y_{0}| + (1 - \rho)\delta \\ &\leq \rho \delta + (1 - \rho)\delta \quad (\because \varphi(x) \in U_{2} = [y_{0} - \delta, y_{0} + \delta]) \\ &= \delta \end{align*}よって、 \(\Phi(\varphi)(x) \in U_{2}\) だから、 \(\Phi(\varphi) \in \mathcal{F}\) 。次に、 \(\varphi, \psi \in \mathcal{F}\) をとると、
\begin{align*} \Phi(\varphi)(x) - \Phi(\psi)(x) &= \varphi(x) - \frac{1}{M} F(x, \varphi(x)) - \left\{ \psi(x) - \frac{1}{M} F(x, \psi(x)) \right\} \\ &= \varphi(x) - \psi(x) - \frac{1}{M} \left\{ F(x, \varphi(x)) - F(x, \psi(x)) \right\} \end{align*}再び平均値の定理より、 \(\varphi(x)\) と \(\psi(x)\) の間に \(\xi_{2}(x)\) を適当に選び、
\begin{equation*} F(x, \varphi(x)) = F(x, \psi(x)) + F_{y}(x, \xi_{2}(x))(\varphi(x) - \psi(x)) \end{equation*}とできるから、
\begin{align*} \Phi(\varphi)(x) - \Phi(\psi)(x) &= \varphi(x) - \psi(x) - \frac{1}{M} \left\{ F_{y}(x, \xi_{2}(x))(\varphi(x) - \psi(x)) \right\} \\ &= \left\{ 1 - \frac{1}{M} F_{y} (x, \xi_{2}(x)) \right\} (\varphi(x) - \psi(x)) \end{align*}となる。 \(\xi_{2}(x) \in U_{2}\) だから、 \(|M - F_{y}(x, \xi_{2}(x))| < \rho |M|\) が成り立ち、
\begin{equation*} |\Phi(\varphi)(x) - \Phi(\psi)(x)| < \rho |\varphi(x) - \psi(x)| \leq \rho || \varphi - \psi ||_{0} \end{equation*}これが任意の \(x \in U_{1}\) で成り立つから、\(\rho || \varphi - \psi ||_{0}\) は \(|\Phi(\varphi)(\ve{x}) - \Phi(\psi)(\ve{x})|\) の上限を与えており、 \(|| \Phi(\varphi) - \Phi(\psi) ||_{0} \leq \rho || \varphi - \psi ||_{0}\) が言える。従って \(\Phi\) は縮小写像である。
次に、 \(\mathcal{F}\) が完備であることを示す。 \(\mathcal{F} \subset C^{0}(U_{1})\) で \(C^{0}(U_{1})\) は完備だから、 \(\mathcal{F}\) の中のコーシー列は \(C^{0}(U_{1})\) の中での収束列である。写像 \(\Phi\) による極限関数 \(f\) は、 \(\Phi\) の作り方により、 \(U_{1}\) 上で連続で、 \(y_{0} = f(x_{0})\) を満たす。また、各点収束として考えると(コーシー列は一様収束性を述べているので可能)、極限関数 \(f(x)\) は閉区間 \(U_{2}\) に属するから、 \(f \in \mathcal{F}\) である。即ち \(\mathcal{F}\) は完備。
以上より不動点定理が使える。即ち、
\begin{equation*} f(x) = \Phi(f)(x) \quad (x \in U_{1}) \end{equation*}を満たす関数が \(\mathcal{F}\) の中に唯一存在する。これは、
\begin{equation*} \Phi(f)(x) = f(x) - \frac{1}{M} F(x, f(x)) \end{equation*}と合わせると、
\begin{equation*} F(x, f(x)) = 0 \quad (x \in U_{1}) \end{equation*}が得られるから、定理1が示された。(1.の証明終)
(2.の証明) \(F\) は \((x_{0}, y_{0})\) で偏微分可能で \(F_{y}(x, y)\) は \(U\) で連続だから、 \(F(x, y)\) は全微分可能である( \(\because\) 準備)。従って \(U\) において、
\begin{equation*} F(x, y) = F(x_{0}, y_{0}) + \alpha(x, y)(x - x_{0}) + \beta(x, y)(y - y_{0}) \end{equation*}とかける( \(\alpha, \beta\) は \((x_{0}, y_{0})\) で連続な関数で、かつ \(\alpha(x_{0}, y_{0}) = F_{x}(x_{0}, y_{0}), \beta(x_{0},\ y_{0}) = F_{y}(x_{0}, y_{0}) \neq 0\))。\(x \in V\) に対して \(y = f(x)\) を代入すると、
\begin{align*} F(x, f(x)) = 0 &= F(x_{0}, f(x_{0})) + \alpha(x, f(x))(x - x_{0}) + \beta(x, f(x))(f(x) - y_{0}) \\ &= \alpha(x, f(x))(x - x_{0}) + \beta(x, f(x))(f(x) - y_{0}) \\ \implies f(x) &= y_{0} - \frac{\alpha(x, f(x))}{\beta(x, f(x))}(x - x_{0}) \end{align*}両辺を \(x - x_{0}\) で割ってから \(x \to x_{0}\) としてみると、\(-\alpha(x, f(x)) / \beta(x, f(x))\) は \(x_{0}\) において(連続関数の商になっているので)連続だから極限値をもつ。即ち \(f(x)\) は \(x_{0}\) で微分可能で、
\begin{equation*} \dfrac{f}{x}(x_{0}) = - \frac{\alpha(x_{0}, f(x_{0}))}{\beta(x_{0}, f(x_{0}))} = - \frac{F_{x}(x_{0}, y_{0})}{F_{y}(x_{0}, y_{0})} \tag{4} \end{equation*}(2.の証明終)
(3.の証明) \(F\) が \(C^{1}\) 級ならば (4) の右辺は \((x_{0}, y_{0})\) で連続だから、 \(y_{0} = f(x_{0})\) を代入したものも \(x_{0}\) で連続である。即ち、 \(\dfrac{f}{x}(x)\) は連続関数( \(C^{0}\) 級)だから、 \(f(x)\) は \(C^{1}\) 級。(3.の証明終)
(4.の証明) \(F\) が \(C^{m}\) 級ならば \(f(x)\) も \(C^{m}\) 級であることを示す。 \(m = 1\) の場合は 3. より成立する。 \(m - 1\) の場合に成立すると仮定して、もし、 \(F\) が \(C^{m}\) 級ならば、同時に \(F\) は \(C^{m-1}\) 級だから、 仮定より \(f(x)\) も \(C^{m-1}\) 級である。従って、
\begin{equation*} \dfrac{f}{x}(x) = - \frac{F_{x}(x, f(x))}{F_{y}(x, f(x))} \end{equation*}の右辺は \(C^{m-1}\) 級の関数 \(F_{x}, F_{y}\) に \(C^{m-1}\) 級の関数 \(f(x)\) を代入したもので、合成関数の微分法から右辺は \(C^{m-1}\) 級である。 \(\dfrac{f}{x}(x)\) が \(C^{m-1}\) 級だから、 \(f(x)\) は \(C^{m}\) 級。(4.の証明終)
多変数の場合
3変数 \(x, y, z\) による連立陰関数
を満たす連続関数 \(y=f(x),\ z = g(x)\) を求める問題を考える。 \(F(x_{0}, y_{0}, z_{0}) = 0,\ F_{y}(x_{0}, y_{0}, z_{0}) \neq 0\) とすると、陰関数定理により、 \((x_{0}, y_{0}, z_{0})\) の近傍で \(y = Y(x, z)\) という陰関数が存在する。これを \(G\) に代入すると、
となるが、もし、 \(G(x_{0}, y_{0}, z_{0}) = 0,\ H_{z}(x_{0}, z_{0}) \neq 0\) ならば、これから \(z = g(x)\) という陰関数が存在する。これを \(y = Y(x, z)\) に代入して、
とおけば、2つの陰関数が求められる。今、
だから、 \(H_{z}(x_{0}, z_{0}) \neq 0\) は、行列
が \((x_{0}, y_{0}, z_{0})\) で正則という条件と同値になる。従って、\(\parfrac{F}{\ve{y}}\) が正則であれば陰関数を持つことが分かる( \(\parfrac{F}{\ve{y}}\) が正則ならば、 \(F_{y}, F_{z}\) のいずれかは \(0\) ではないから、 \(F_{y}(x_{0}, y_{0}, z_{0}) \neq 0\) という条件をおいても良い)。これを一般化した定理を以下に示す。
- 陰関数定理(多変数)
\(\mathbb{R}^{p} \times \mathbb{R}^{n}\) の領域 \(\Omega\) で、 \(n\) 次元写像
\begin{equation*} \ve{F}(\ve{x}, \ve{y}) = \left[ \begin{array}{c} F_{1}(x_{1}, ..., x_{p}, y_{1}, ..., y_{n}) \\ F_{2}(x_{1}, ..., x_{p}, y_{1}, ..., y_{n}) \\ \vdots \\ F_{n}(x_{1}, ..., x_{p}, y_{1}, ..., y_{n}) \end{array} \right] \end{equation*}は連続として、1点 \((\ve{x}_{0}, \ve{y}_{0})^{\mathsf{T}} = (x_{1}^{0}, ..., x_{p}^{0}, y_{1}^{0}, ..., y_{n}^{0})^{\mathsf{T}}\) の近傍 \(U\) でサイズ \(n \times n\) の正方行列関数
\begin{equation*} \parfrac{\ve{F}}{\ve{y}}(\ve{x}, \ve{y}) = \left[ \begin{array}{cccc} \parfrac{F_{1}}{y_{1}} & \parfrac{F_{1}}{y_{2}} & \dots & \parfrac{F_{1}}{y_{n}} \\ \parfrac{F_{2}}{y_{1}} & \parfrac{F_{2}}{y_{2}} & \dots & \parfrac{F_{2}}{y_{n}} \\ \vdots & \vdots & \ddots & \vdots \\ \parfrac{F_{n}}{y_{1}} & \parfrac{F_{n}}{y_{2}} & \dots & \parfrac{F_{n}}{y_{n}} \end{array} \right] \end{equation*}は連続な正則行列とする。とのとき、次の 1 - 4 が成り立つ。
- もし \(\ve{F}(\ve{x}_{0}, \ve{y}_{0}) = \ve{0}\) ならば、 \((\ve{x}_{0}, \ve{y}_{0})\) の十分小さい近傍 \(V\) があって
\begin{equation*} \ve{y}_{0} = \ve{f}(\ve{x}_{0}), \ \ve{F}(\ve{x}, \ve{f}(\ve{x})) = \ve{0} \quad (\ve{x}, \ve{f}(\ve{x})) \in V \end{equation*}を満たす \(n\) 次元ベクトル値連続関数 \(\ve{f}(\ve{x})\) が唯一存在する。
- 1が成り立つとき、 \(\ve{F}\) が \((\ve{x}_{0}, \ve{y}_{0})\) において \(\ve{x}\) について微分可能なら、 \(\ve{f}(\ve{x})\) は \(\ve{x}_{0}\) において微分可能で、
\begin{equation*} \parfrac{\ve{f}}{\ve{x}}(\ve{x}_{0}) = - \left[ \parfrac{\ve{F}}{\ve{y}}(\ve{x}_{0}, \ve{y}_{0}) \right]^{-1} \parfrac{\ve{F}}{\ve{x}}(\ve{x}_{0}, \ve{y}_{0}) \end{equation*}- 2が成り立つとき、 \(\ve{F}\) が \(U\) 上で \(C^{1}\) 級なら、 \(\ve{f}(\ve{x})\) も \(C^{1}\) 級で、
\begin{equation*} \parfrac{\ve{f}}{\ve{x}}(\ve{x}) = - \left[ \parfrac{\ve{F}}{\ve{y}}(\ve{x}, \ve{y}) \right]^{-1} \parfrac{\ve{F}}{\ve{x}}(\ve{x}, \ve{y}) \end{equation*}- 3が成り立つとき、 \(\ve{F}\) が \(U\) 上で \(C^{m}\) 級なら、 \(\ve{f}(\ve{x})\) も \(C^{m}\) 級である。
証明については2変数と同様に考える。
(1.の証明) \(\ve{x}_{0}\) の近傍 \(U_{1}\) と \(\ve{y}_{0}\) の近傍 \(U_{2}\) を適当に選んで \(U_{1} \times U_{2} \subset U\) となるようにしておく。次に、行列 \(\ve{M}\) として
\begin{equation*} \ve{M} = \parfrac{\ve{F}}{\ve{y}}(\ve{x}_{0}, \ve{y}_{0}) \end{equation*}とおく。 \(\ve{M}\) は仮定より正則行列である。 \(\rho \in (0, 1)\) なる \(\rho\) を1つ取り、これに応じて \(U_{1}, U_{2}\) を小さく取り直して
\begin{equation*} \left| \ve{M} - \parfrac{\ve{F}}{\ve{y}}(\ve{x}, \ve{y}) \right| < \frac{\rho}{|\ve{M}^{-1}|} \quad (\ve{x}, \ve{y}) \in U_{1} \times U_{2} \end{equation*}となる様にしておく( \(|\ve{M}| = \sup_{|\ve{x}| = 1} |\ve{M}\ve{x}|\) : 行列ノルム)。 \(U_{2}\) は、
\begin{equation*} U_{2} = \left\{ \ve{y} | |\ve{y} - \ve{y}_{0}| \leq \delta \right\} \end{equation*}と閉集合にとり、この \(\delta\) に応じて \(U_{1}\) を更に小さく取り直し、
\begin{equation*} |\ve{F}(\ve{x}, \ve{y}_{0})| < (1 - \rho)\frac{\delta}{|\ve{M}^{-1}|} \quad \ve{x} \in U_{1} \end{equation*}が成り立つようにしておく(これは、\(\ve{F}(\ve{x}_{0}, \ve{y}_{0}) = \ve{0}\) かつ \(\ve{F}\) の連続性により可能)。
\(\ve{x}\) の関数の集合 \(\mathcal{F}\) として、 \(U_{1}\) 上で連続で、 \(\ve{y}_{0} = \ve{\varphi}(\ve{x}_{0})\) となり、かつ、
\begin{equation*} \ve{\varphi}(\ve{x}) \in U_{2} \quad \ve{x} \in U_{1} \end{equation*}となるような写像 \(\ve{\varphi}(\ve{x})\) の全体をとる。そして写像 \(\ve{\Phi}(\ve{\varphi})\) として、
\begin{equation*} \ve{\Phi}(\ve{\varphi})(\ve{x}) = \ve{\varphi}(\ve{x}) - \ve{M}^{-1} \ve{F}(\ve{x}, \ve{\varphi}(\ve{x})) \end{equation*}とおく。上で述べた積分公式より、
\begin{equation*} \ve{F}(\ve{x}, \ve{\varphi}(\ve{x})) = \ve{F}(\ve{x}, \ve{y}_{0}) + \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{y}_{0} + t (\ve{\varphi}(\ve{x}) - \ve{y}_{0})) \mathrm{d} t (\ve{\varphi}(\ve{x}) - \ve{y}_{0}) \end{equation*}だから、
\begin{align*} \ve{\Phi}(\ve{\varphi})(\ve{x}) - \ve{y}_{0} &= \ve{\varphi}(\ve{x}) - \ve{y}_{0} - \ve{M}^{-1} \ve{F}(\ve{x}, \ve{\varphi}(\ve{x})) \\ &= \ve{\varphi}(\ve{x}) - \ve{y}_{0} - \ve{M}^{-1} \ve{F}(\ve{x}, \ve{y}_{0}) - \ve{M}^{-1} \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{y}_{0} + t (\ve{\varphi}(\ve{x}) - \ve{y}_{0})) \mathrm{d} t (\ve{\varphi}(\ve{x}) - \ve{y}_{0}) \\ &= \left\{ \ve{I} - \ve{M}^{-1} \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{y}_{0} + t (\ve{\varphi}(\ve{x}) - \ve{y}_{0})) \mathrm{d} t \right\} \left\{ \ve{\varphi}(\ve{x}) - \ve{y}_{0} \right\} - \ve{M}^{-1}\ve{F}(\ve{x}, \ve{y}_{0}) \\ \implies |\ve{\Phi}(\ve{\varphi})(\ve{x}) - \ve{y}_{0}| &\leq \left| \ve{I} - \ve{M}^{-1} \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{y}_{0} + t (\ve{\varphi}(\ve{x}) - \ve{y}_{0})) \mathrm{d} t \right||\ve{\varphi}(\ve{x}) - \ve{y}_{0}| + |\ve{M}^{-1}\ve{F}(\ve{x}, \ve{y}_{0})| \end{align*}となる。ここで、
\begin{align*} \left| \ve{I} - \ve{M}^{-1} \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} \mathrm{d} t \right| &= \left| \ve{M}^{-1}\left( \ve{M} - \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} \mathrm{d} t \right) \right| \\ &\leq |\ve{M}^{-1}| \int_{0}^{1} \left| \ve{M} - \parfrac{\ve{F}}{\ve{y}} \right| \mathrm{d} t \\ &< |\ve{M}^{-1}| \int_{0}^{1} \frac{\rho}{|\ve{M}^{-1}|} \mathrm{d} t = \rho \end{align*}が成り立つ。更に、 \(\ve{\varphi}(\ve{x}) \in U_{2}\) より、 \(|\ve{\varphi}(\ve{x}) - \ve{y}_{0}| \leq \delta\) 。しかも、
\begin{equation*} |\ve{M}^{-1}\ve{F}(\ve{x}, \ve{y}_{0})| \leq |\ve{M}^{-1}||\ve{F}(\ve{x}, \ve{y}_{0})| < (1 - \rho) \delta \end{equation*}だから、
\begin{equation*} |\ve{\Phi}(\ve{\varphi})(\ve{x}) - \ve{y}_{0}| < \rho \delta + (1 - \rho) \delta = \delta \end{equation*}従って \(\ve{\Phi}(\ve{\varphi}) \in \mathcal{F}\) である。
次に、 \(\ve{\varphi}, \ve{\psi} \in \mathcal{F}\) に対し、
\begin{equation*} \ve{\Phi}(\ve{\varphi})(\ve{x}) - \ve{\Phi}(\ve{\psi})(\ve{x}) = \ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x}) - \ve{M}^{-1} ( \ve{F}(\ve{x}, \ve{\varphi}(\ve{x})) - \ve{F}(\ve{x}, \ve{\psi}(\ve{x})) ) \end{equation*}が成立するが、ここで積分公式
\begin{equation*} \ve{F}(\ve{x}, \ve{\varphi}(\ve{x})) - \ve{F}(\ve{x}, \ve{\psi}(\ve{x})) = \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{y}_{0} + t (\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x}))) \mathrm{d} t (\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x})) \end{equation*}を用いると、
\begin{align*} \ve{\Phi}(\ve{\varphi})(\ve{x}) - \ve{\Phi}(\ve{\psi})(\ve{x}) &= \ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x}) - \ve{M}^{-1} \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{\varphi}(\ve{x}) + t (\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x}))) \mathrm{d} t (\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x})) \\ &= \left\{ \ve{I} - \ve{M}^{-1} \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{\varphi}(\ve{x}) + t (\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x}))) \mathrm{d} t \right\} (\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x})) \\ \implies |\ve{\Phi}(\ve{\varphi})(\ve{x}) - \ve{\Phi}(\ve{\psi})(\ve{x})| &= \left| \ve{I} - \ve{M}^{-1} \int_{0}^{1} \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{\varphi}(\ve{x}) + t (\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x}))) \mathrm{d} t \right| |\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x})| \\ &< \rho |\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x})| \leq \rho ||\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x})||_{0} \end{align*}が任意の \(\ve{x} \in U_{1}\) で成り立つから、
\begin{equation*} ||\ve{\Phi}(\ve{\varphi})(\ve{x}) - \ve{\Phi}(\ve{\psi})(\ve{x})||_{0} \leq \rho ||\ve{\varphi}(\ve{x}) - \ve{\psi}(\ve{x})||_{0} \end{equation*}よって \(\ve{\Phi}\) は縮小写像。
次に \(\mathcal{F}\) が完備であることを示す。まず、 \(\mathcal{F} \subset C^{0}(U_{1})\) で \(C^{0}(U_{1})\) は完備だから、 \(\mathcal{F}\) の中で作ったコーシー列は \(C^{0}(U_{1})\) の中で収束列となる。極限関数 \(\ve{f} = \lim_{n \to \infty} \ve{\Phi}(\ve{f}_{n})\) が \(\mathcal{F}\) に属することを示す。 \(\ve{\Phi}\) の定義より、 \(\ve{f}\) は \(U_{1}\) 上で連続で、 \(\ve{y}_{0} = \ve{f}(\ve{x}_{0})\) を満たす。各点収束としてみると、 \(\ve{f}(\ve{x})\) は 区間 \(U_{1}\) で閉区間 \(U_{2}\) に属するから、 \(\ve{f} \in \mathcal{F}\) である。即ち \(\mathcal{F}\) は完備。
不動点定理により、 \(\ve{f}(\ve{x}) = \ve{\Phi}(\ve{f})(\ve{x})\) を満たす \(\ve{f}(\ve{x}) \in \mathcal{F}\) が唯一存在する。この写像 \(\ve{f}\) は \(\ve{f}(\ve{x}) = \ve{\Phi}(\ve{f})(\ve{x}) = \ve{f}(\ve{x}) - \ve{M}^{-1}\ve{F}(\ve{x}, \ve{f}(\ve{x}))\) を満たすので、\(\ve{F}(\ve{x}, \ve{f}(\ve{x})) = \ve{0}\) が成り立っている。(1. の証明終)
(2.の証明) \(\ve{F}\) は \((\ve{x}_{0}, \ve{y}_{0})\) で偏微分可能で、しかも連続だから微分可能で( \(\because\) 上述)であり、
\begin{equation*} \ve{F}(\ve{x}, \ve{y}) = \ve{F}(\ve{x}_{0}, \ve{y}_{0}) + \ve{A}(\ve{x}, \ve{y})(\ve{x} - \ve{x}_{0}) + \ve{B}(\ve{x}, \ve{y})(\ve{y} - \ve{y}_{0}) \end{equation*}と書ける( \(\ve{A}, \ve{B}\) は \((\ve{x}_{0}, \ve{y}_{0})\) で連続な行列関数で、 \(\ve{A}(\ve{x}_{0}, \ve{y}_{0}) = \parfrac{\ve{F}}{\ve{x}}(\ve{x}_{0}, \ve{y}_{0}),\ \ve{B}(\ve{x}_{0}, \ve{y}_{0}) = \parfrac{\ve{F}}{\ve{y}}(\ve{x}_{0}, \ve{y}_{0})\) )。この式に \(\ve{y} = \ve{f}(\ve{x})\) を代入すると、
\begin{align*} \ve{F}(\ve{x}, \ve{f}(\ve{x})) = \ve{0} &= \ve{F}(\ve{x}_{0}, \ve{f}(\ve{x}_{0})) + \ve{A}(\ve{x}, \ve{f}(\ve{x}))(\ve{x} - \ve{x}_{0}) + \ve{B}(\ve{x}, \ve{f}(\ve{x}))(\ve{f}(\ve{x}) - \ve{f}(\ve{x}_{0})) \\ \implies \ve{B}(\ve{x}, \ve{f}(\ve{x})) \ve{f}(\ve{x}) &= \ve{B}(\ve{x}, \ve{f}(\ve{x})) \ve{f}(\ve{x}_{0}) - \ve{A}(\ve{x}, \ve{f}(\ve{x}))(\ve{x} - \ve{x}_{0}) \\ \implies \ve{f}(\ve{x}) &= \ve{f}(\ve{x}_{0}) - \ve{B}(\ve{x}, \ve{f}(\ve{x}))^{-1} \ve{A}(\ve{x}, \ve{f}(\ve{x}))(\ve{x} - \ve{x}_{0}) \quad (\because \parfrac{\ve{F}}{\ve{y}} \text{は正則}) \end{align*}行列 \(\ve{B}(\ve{x}, \ve{f}(\ve{x}))^{-1} \ve{A}(\ve{x}, \ve{f}(\ve{x}))\) は \(\ve{x}_{0}\) において連続だから、 \(\ve{f}\) は \(\ve{x}_{0}\) において微分可能で、
\begin{equation*} \parfrac{\ve{f}}{\ve{x}}(\ve{x}_{0}) = \ve{B}(\ve{x}_{0}, \ve{f}(\ve{x}_{0}))^{-1} \ve{A}(\ve{x}_{0}, \ve{f}(\ve{x}_{0})) = -\left[ \parfrac{\ve{F}}{\ve{y}} (\ve{x}_{0}, \ve{y}_{0}) \right]^{-1} \parfrac{\ve{F}}{\ve{x}} (\ve{x}_{0}, \ve{y}_{0}) \tag{5} \end{equation*}(2.の証明終)
(3.の証明) \(\ve{F}\) が \(C^{1}\) 級ならば(5)式の右辺は \((\ve{x}_{0}, \ve{y}_{0})\) で連続だから、 \(\ve{y}_{0} = \ve{f}(\ve{x}_{0})\) を代入したものも \(\ve{x}_{0}\) で連続である。即ち、 \(\parfrac{\ve{f}}{\ve{x}}(\ve{x})\) は \(U\) で連続であり、 \(\ve{f}\) は \(C^{1}\) 級。(3.の証明終)
(4.の証明) \(\ve{F}\) が \(C^{m}\) 級ならば、 \(\ve{f}\) も \(C^{m}\) 級であることを示す。 \(m = 1\) の場合は、3.により成立する。 \(m-1\) の場合に成立するとして、もし、 \(\ve{F}\) が \(C^{m}\) 級ならば、同時に \(\ve{F}\) は \(C^{m-1}\) 級だから、仮定より \(\ve{f}\) も \(C^{m-1}\) 級である。よって、
\begin{equation*} \parfrac{\ve{f}}{\ve{x}}(\ve{x}) = \ve{B}(\ve{x}, \ve{f}(\ve{x}))^{-1} \ve{A}(\ve{x}, \ve{f}(\ve{x})) = -\left[ \parfrac{\ve{F}}{\ve{y}} (\ve{x}, \ve{y}) \right]^{-1} \parfrac{\ve{F}}{\ve{x}} (\ve{x}, \ve{y}) \end{equation*}の右辺は \(C^{m-1}\) 級の写像 \(\parfrac{\ve{F}}{\ve{y}},\ \parfrac{\ve{F}}{\ve{x}}\) に \(C^{m-1}\) 級の写像 \(\ve{f}\) を代入したものだから、合成関数の微分法により、右辺は \(C^{m-1}\) 級になる。 \(\parfrac{f}{x}(\ve{x})\) が \(C^{m-1}\) 級だから、 \(\ve{f}(\ve{x})\) は \(C^{m}\) 級。(4.の証明終)
陰関数定理の応用
逆写像定理
2変数を例に取って考える。 \(\mathbb{R}^{2}\) から \(\mathbb{R}^{2}\) への写像
が与えられたとき、その逆写像が存在するかどうかを考える。今、
とおくと、
から陰関数 \(s = h(x, y),\ t = k(x, y)\) が決まるか?という問題に帰着できる。 この問題は陰関数定理より解決できる。すなわち、行列
がある点 \((x_{0}, y_{0}, s_{0}, t_{0})\) の近傍で連続かつ正則であればよい。また、
だから、上の条件は写像 \((f(s, t), g(s, t))^{\mathsf{T}}\) のヤコビ行列
が \((s_{0}, t_{0})\) の近傍で連続かつ正則であることを示している。
多変数の場合
上記の議論を一般の \(n\) 変数に拡張したのが次の 逆写像定理 である。
- 逆写像定理
\(\mathbb{R}^{n}\) の領域 \(\Omega\) から \(\mathbb{R}^{n}\) への写像 \(\ve{y} = \ve{f}(\ve{x})\) が \(\Omega\) の1点 \(\ve{x}_{0}\) の近傍で \(C^{1}\) 級かつヤコビ行列 \(\parfrac{\ve{f}}{\ve{x}}(\ve{x})\) が正則ならば、逆写像 \(\ve{x} = \ve{h}(\ve{y})\) が \(\ve{y}_{0} = \ve{f}(\ve{x}_{0})\) の十分小さい近傍で存在し \(C^{1}\) 級である。その導関数は、
\begin{equation*} \parfrac{\ve{h}}{\ve{y}}(\ve{y}) = \left[ \parfrac{\ve{f}}{\ve{x}}(\ve{h}(\ve{y})) \right]^{-1} \end{equation*}である。また、 \(\ve{f}\) が \(C^{m}\) 級ならば \(\ve{h}\) も \(C^{m}\) 級である。
(証明)陰関数定理を \(\ve{F}(\ve{x}, \ve{y}) = \ve{f}(\ve{x}) - \ve{y}\) に適用すれば良い。 \(\ve{F}(\ve{x}, \ve{y})\) は連続で、 \(\parfrac{\ve{F}}{\ve{x}} = \parfrac{\ve{f}}{\ve{x}}\) は \(\ve{x}_{0}\) の近傍で連続な正則関数だから、陰関数定理により \(\ve{y}_{0}\) の近傍で \(\ve{x}_{0} = \ve{h}(\ve{y}_{0}),\ \ve{F}(\ve{h}(\ve{y}), \ve{y}) = \ve{0}\) を満たす連続な写像 \(\ve{h}\) が唯一存在する。 \(\ve{h}(\ve{y})\) の導関数は、
\begin{align*} \parfrac{\ve{h}}{\ve{y}}(\ve{y}) &= - \left[ \parfrac{\ve{F}}{\ve{x}} (\ve{x}, \ve{y}) \right]^{-1} \parfrac{\ve{F}}{\ve{y}}(\ve{x}, \ve{y}) \\ &= - \left[ \parfrac{\ve{f}}{\ve{x}} (\ve{x}, \ve{y}) \right]^{-1} (- \ve{I}) \\ &= \left[ \parfrac{\ve{f}}{\ve{x}}(\ve{h}(\ve{y})) \right]^{-1} \end{align*}また、 \(\ve{f}\) が \(C^{m}\) 級であれば、 \(\ve{F}\) も \(C^{m}\) 級であり、陰関数定理の4.より \(\ve{h}\) も \(C^{m}\) 級となる。(証明終)
制約付き極値問題
ラグランジュの未定乗数法
ラグランジュの未定乗数法も、勾配の図を用いた直感に頼るのではなく陰関数定理により説明が可能である。
やはり例として2変数 \(x, y\) で考える。 \(\mathbb{R}^{2}\) のある領域 \(\Omega\) 上で、2つの2変数関数 \(f(x, y),\ g(x, y)\) が与えたられたとき、 \(g(x, y) = 0\) という条件下で \(f(x, y)\) の極値を求めることを考える。
\(g(x, y) = 0\) と交わる \(f(x, y) = a\) の交点が極値をとるならば、その点で \(f(x, y) = a\) と \(g(x, y) = 0\) のグラフは接しなければならない。その様な点では、法線ベクトル \(\parfrac{f}{\ve{x}}, \parfrac{f}{\ve{x}}\) は同じ方向を向いているから、
を満たす定数 \(\lambda\) が存在する。この式は形式上、
の3変数関数の極値問題と同様の形をしている。より詳しい証明は以下。
- ラグランジュの未定乗数法
領域 \(\Omega\) 上で2つの関数 \(f(x, y),\ g(x, y)\) は \(C^{1}\) 級とし、曲線 \(g(x, y) = 0\) 上で \(\parfrac{g}{\ve{x}} \neq \ve{0}\) とする。 \(g(x, y) = 0\) 上の点 \(\ve{x}_{0} = (x_{0}, y_{0})\) が条件付き極値問題における極値点ならば、ある定数 \(\lambda\) が存在して、
\begin{equation*} \parfrac{f}{\ve{x}}(\ve{x}_{0}) = \lambda \parfrac{g}{\ve{x}}(\ve{x}_{0}) \end{equation*}(証明) 仮定の \(\parfrac{g}{\ve{x}} \neq \ve{0}\) より \(\parfrac{g}{y}(\ve{x}_{0}) \neq 0\) が成立している。 \(g(x, y) = 0\) を陰関数表示だと思うと、陰関数定理により、 \(\ve{x}_{0} = (x_{0}, y_{0})\) の近傍において \(y_{0} = \varphi(x_{0}),\ \dfrac{\varphi}{x}(x) = -g_{x}(x, \varphi(x)) / g_{y}(x, \varphi(x))\) を満たす \(C^{1}\) 級の関数 \(y = \varphi(x)\) が存在する。 \(z = f(x, \varphi(x))\) の導関数を考えると、
\begin{align*} \dfrac{z}{x} &= \parfrac{f}{x} (x, \varphi(x)) + \parfrac{f}{y}(x, \varphi(x)) \dfrac{\varphi}{x}(x) \quad (\because \text{合成関数の微分}) \\ &= f_{x}(x, \varphi(x)) + f_{y}(x, \varphi(x)) \left\{ - \frac{g_{x}(x, \varphi(x))}{g_{y}(x, \varphi(x))} \right\} \\ &= \frac{1}{g_{y}} (f_{x} g_{y} - f_{y} g_{x}) \end{align*}点 \(\ve{x}_{0}\) においてこれが \(0\) になるから、 \(f_{x}g_{y} - f_{y}g_{x} = 0\) 。従って \(f_{x}/g_{x} = f_{y}/g_{y} = \lambda\) とおくと、\(f_{x} = \lambda g_{x},\ f_{y} = \lambda g_{y}\) が得られ、まとめると \(\parfrac{f}{\ve{x}}(\ve{x}_{0}) = \lambda \parfrac{g}{\ve{x}}(\ve{x}_{0})\) が得られる。(証明終)
制約条件が \(g_{i}(\ve{x}) = 0\ (i = 1, ..., m)\) と増えた場合も同様に考えられる。
- ラグランジュの未定乗数法(複数制約)
\(\mathbb{R}^{n}\) の領域 \(\Omega\) 上で \(C^{1}\) 級の関数 \(f(\ve{x}),\ g_{i}(\ve{x})\ (i = 1, ..., m)\) が与えられ、 \(n-m\) 次元曲面 \(S = \{ \ve{x} | g_{i}(\ve{x}) = 0, \ i = 1,...,m \}\) 上で行列 \(\parfrac{\ve{g}}{\ve{x}} = \left( \parfrac{g_{i}}{x_{j}} \right)\) の階数(行列ランク)は常に \(m\) であるとする。\(S\) 上の点 \(\ve{x}_{0}\) が \(f(\ve{x})\) の \(S\) の極値点ならば、 \(m\) 個の定数 \(\lambda_{1}, ..., \lambda_{m}\) があって、
\begin{equation*} \parfrac{f}{\ve{x}}(\ve{x}_{0}) = \sum_{i = 1}^{m} \lambda_{i} \parfrac{g_{i}}{\ve{x}}(\ve{x}_{0}) \end{equation*}(証明) \(\parfrac{\ve{g}}{\ve{x}}\) の階数は \(m\) だから、 \(\ve{x}^{\prime} = [x_{1}, ..., x_{n - m}],\ \ve{x}^{\prime\prime} = [x_{n - m + 1}, ..., x_{n}]\) として、
\begin{equation*} \parfrac{\ve{g}}{\ve{x}^{\prime\prime}} = \left[ \begin{array}{cccc} \parfrac{g_{1}}{x_{n-m+1}} & \parfrac{g_{1}}{x_{n-m+2}} & \dots & \parfrac{g_{1}}{x_{n}} \\ \parfrac{g_{2}}{x_{n-m+1}} & \parfrac{g_{2}}{x_{n-m+2}} & \dots & \parfrac{g_{2}}{x_{n}} \\ \vdots & \vdots & \ddots & \vdots \\ \parfrac{g_{m}}{x_{n-m+1}} & \parfrac{g_{m}}{x_{n-m+2}} & \dots & \parfrac{g_{m}}{x_{n}} \\ \end{array} \right] \end{equation*}は正則であると仮定して良い(正則になるように \(\ve{x}^{\prime\prime}\) を選べば良い)。 \(\ve{g}(\ve{x}) = \ve{0}\) を陰関数表示と見ると、陰関数定理により \(x_{n-m+1} = \varphi_{1}(\ve{x}^{\prime}), ..., x_{n} = \varphi_{m}(\ve{x}^{\prime})\) 、即ち \(\ve{x}^{\prime\prime} = \ve{\varphi}(\ve{x}^{\prime})\) を満たす \(C^{1}\) 級の写像 \(\ve{\varphi} = [\varphi_{1}, ..., \varphi_{m}]\) が存在し、また、 \(\parfrac{\ve{\varphi}}{\ve{x}^{\prime}} = -\left(\parfrac{\ve{g}}{\ve{x}^{\prime\prime}}\right)^{-1}\left(\parfrac{\ve{g}}{\ve{x}^{\prime}}\right)\) が成り立つ。\(\ve{\varphi}\) を \(y = f(\ve{x}) = f(\ve{x}^{\prime}, \ve{x}^{\prime\prime})\) に代入すると、
\begin{equation*} y = F(\ve{x}^{\prime}) = f(\ve{x}^{\prime}, \ve{\varphi}(\ve{x}^{\prime})) \end{equation*}が得られる。上記 \(y\) についての極値問題を考える。 \(\ve{x}_{0}\) において、
\begin{align*} \parfrac{F}{\ve{x}^{\prime}} &= \parfrac{f}{\ve{x}^{\prime}} + \parfrac{f}{\ve{x}^{\prime\prime}} \parfrac{\ve{\varphi}}{\ve{x}^{\prime}} \quad (\because \text{連鎖律}) \\ &= \parfrac{f}{\ve{x}^{\prime}} - \parfrac{f}{\ve{x}^{\prime\prime}} \left(\parfrac{\ve{g}}{\ve{x}^{\prime\prime}}\right)^{-1} \parfrac{\ve{g}}{\ve{x}^{\prime}} = \ve{0} \end{align*}が極値となるための必要条件だから、今、
\begin{equation*} [\lambda_{1}, ..., \lambda_{m}] = \parfrac{f}{\ve{x}^{\prime\prime}} \left(\parfrac{\ve{g}}{\ve{x}^{\prime\prime}}\right)^{-1} \end{equation*}とおけば、
\begin{equation*} \parfrac{f}{\ve{x}^{\prime\prime}}(\ve{x}_{0}) = [\lambda_{1}, ..., \lambda_{m}] \parfrac{\ve{g}}{\ve{x}^{\prime\prime}}(\ve{x}_{0}),\ \parfrac{f}{\ve{x}^{\prime}}(\ve{x}_{0}) = [\lambda_{1}, ..., \lambda_{m}] \parfrac{\ve{g}}{\ve{x}^{\prime}}(\ve{x}_{0}) \end{equation*}が成立しているから、まとめると、
\begin{equation*} \parfrac{f}{\ve{x}}(\ve{x}_{0}) = [\lambda_{1}, ..., \lambda_{m}] \parfrac{\ve{g}}{\ve{x}}(\ve{x}_{0}) = \sum_{i = 1}^{m} \lambda_{i} \parfrac{g_{i}}{\ve{x}}(\ve{x}_{0}) \end{equation*}が得られる。(証明終)
KKT条件
不等式制約 \(g(x, y) \geq 0\) の条件下で \(f(x, y)\) の極値を見つける問題を考える。
- 簡単な例: \(g(x, y) = y \geq 0\)
\(y \geq 0\) の領域の内部であれば、極大点の候補は \(\parfrac{f}{x} = \parfrac{f}{y} = 0\) で求められる。一方、境界上( \(y = 0\) )では、
\begin{equation*} \parfrac{f}{x}(x_{0}, 0) = 0,\ \parfrac{f}{y}(x_{0}, 0) \leq 0 \end{equation*}を満たす \(x_{0}\) が候補となる( \(\parfrac{f}{y}(x_{0}, 0) > 0\) とすると、それは \(y\) を正方向に増やしたときに \(f\) が更に増加することを意味するから、その点は極大点ではない)。これらの条件をまとめると、極点 \((x_{0}, y_{0})\) は次の条件を満たす必要がある。
\begin{equation*} \parfrac{f}{x}(x_{0}, y_{0}) = 0,\ \parfrac{f}{y}(x_{0}, y_{0}) \leq 0,\ y_{0} \parfrac{f}{y}(x_{0}, y_{0}) = 0 \end{equation*}最後の条件は、 \(y_{0} = 0\) あるいは \(\parfrac{f}{y}(x_{0}, y_{0}) = 0\) を要請している。
次に一般の条件式 \(g(x, y) \leq 0\) を考える。今、新しい変数 \(z\) として
をおけば、元の問題を \(z \geq 0\) における等式制約の条件付き極値問題に変換できる。よって、ラグランジュの未定乗数法により、
の \(z \geq 0\) における極値を求めれば良い。これは、簡単な例の観察を元に、
を満たす \((x, y, z, \lambda)\) を求める問題になる。偏微分を行うと、
となり、後ろの4条件をまとめると、以下の条件が得られる。
とまとめられる。極小値を求める場合は、 \(-f(x, y)\) の極大値を求めれば良い。この場合の条件は、
となり、 \(-\lambda\) を \(\lambda\) に置き換えることで必要条件が得られる。
制約条件が増えても同様に考えれば良いから、次の定理が成立する。これを一般にKKT条件(Karush-Kuhn-Tucker condition)と呼ぶ。
- KKT条件
\(f(\ve{x}), g_{i}(\ve{x})\ (i = 1, ..., m)\) は \(C^{1}\) 級とする。 \(g_{i}(\ve{x}) \geq 0\ (i = 1,...,m)\) という条件の下で、 \(f(\ve{x})\) の極大点 \(\ve{x}_{0}\) は次の条件を満たさなければならない:
ある定数 \(\lambda_{1}, ..., \lambda_{m}\) があって、 \(\ve{x}_{0}\) において
\begin{equation*} \begin{cases} \displaystyle \parfrac{f}{\ve{x}}(\ve{x}_{0}) = \sum_{i = 1}^{m} \lambda_{i} \parfrac{g_{i}}{\ve{x}}(\ve{x}_{0}) \\ \lambda_{i} g_{i}(\ve{x}_{0}) = 0,\ g_{i}(\ve{x}_{0}) \geq 0,\ \lambda_{i} \leq 0 \quad (i = 1, ..., m) \end{cases} \end{equation*}(証明)変数 \(z_{i}\ (i = 1, ..., m)\) を用いて
\begin{equation*} g_{i}(\ve{x}) = z_{i},\ z_{i} \geq 0 \quad (i = 1,...,m) \end{equation*}とおく。定数を \(\lambda_{1}, ..., \lambda_{m}\) としてラグランジュの未定乗数法を適用すると、
\begin{equation*} F(\ve{x}, \ve{z}, \ve{\lambda}) = f(\ve{x}) - \sum_{i = 1}^{m} \lambda_{i} \left\{ g_{i}(\ve{x}) - z_{i} \right\} \end{equation*}であり、極値条件は、
\begin{equation*} \left\{ \begin{array}{ll} \displaystyle \parfrac{F}{\ve{x}}(\ve{x}_{0}, \ve{z}, \ve{\lambda}) = \parfrac{f}{\ve{x}}(\ve{x}_{0}) - \sum_{i = 1}^{m} \lambda_{i} \parfrac{g_{i}}{\ve{x}}(\ve{x}_{0}) = \ve{0} & \\ \displaystyle \parfrac{F}{z_{i}}(\ve{x}_{0}, \ve{z}, \ve{\lambda}) = \lambda_{i} \leq 0 & (i = 1,...,m) \\ \displaystyle \parfrac{F}{\lambda_{i}}(\ve{x}_{0}, \ve{z}, \ve{\lambda}) = -g_{i}(\ve{x}_{0}) + z_{i} = 0 & (i = 1,...,m) \\ \displaystyle z_{i} \parfrac{F}{z_{i}}(\ve{x}_{0}, \ve{z}, \ve{\lambda}) = z_{i}\lambda_{i} = 0 & (i = 1,...,m) \\ z_{i} \geq 0 & (i = 1,...,m) \end{array} \right. \end{equation*}\(z_{i} = g_{i}(\ve{x})\) を元に条件をまとめ直すと、
\begin{equation*} \begin{cases} \displaystyle \parfrac{f}{\ve{x}}(\ve{x}_{0}) = \sum_{i = 1}^{m} \lambda_{i} \parfrac{g_{i}}{\ve{x}}(\ve{x}_{0}) \\ \lambda_{i} g_{i}(\ve{x}_{0}) = 0,\ g_{i}(\ve{x}_{0}) \geq 0,\ \lambda_{i} \leq 0 \quad (i = 1, ..., m) \end{cases} \end{equation*}(証明終)