この記事は,
旧ブログ から移植された記事です. よって, その内容として,
旧ブログ に依存した文脈が含まれている可能性があります. 予めご了承下さい.
久しぶりにまたなにか d3.js で視覚化してみたくなったのだが,
このエントリがポストされる次の日はアイザック・ニュートン の誕生日らしいので, 今回はニュートン法 (Newton Raphson 法) を視覚化してみることにした.
早速であるが以下がその成果物である.
f ( x ) = 0 f(x)=0 f ( x ) = 0 となる関数 f ( x ) f(x) f ( x ) とその導関数 f ′ ( x ) f'(x) f ′ ( x ) 及びニュートン法の初期値を受け付け,
実行をクリックすると関数とニュートン法の計算過程における接線がプロットされる.
デフォルトでは, 2 \sqrt{2} 2 の値を計算するように設定してある.
入力された関数を元に数値微分をしても良かったのだが,
なんとなく導関数を入力したかったので, そのようなことはしなかった.
これで終わってしまうと何とも寂しいので, 一応簡単にニュートン法について書く.
ニュートン法はとても有名な方程式の近似解を求める方法の 1 つである.
連続的関数 f ( x ) f(x) f ( x ) が f ( x ) = 0 f(x)=0 f ( x ) = 0 となるような x x x を求めるときに,
予め決めた, あるいは事前の計算で求まった切片 x n x_{n} x n における関数 f ( x ) f(x) f ( x ) への接線
f ′ ( x n ) f'(x_{n}) f ′ ( x n ) の切片 x n + 1 x_{n+1} x n + 1 を用いて再帰的に f ( x ) = 0 f(x)=0 f ( x ) = 0 に近づけていくことで求める.
同手法は非常に単純ながらも効率的な近似解法であり, 同手法から発展されたいくつかの手法が考えられている.
いまニュートン法の漸化式を導出することを考える.
計算で必要となるのは f ′ ( x n ) f'(x_{n}) f ′ ( x n ) に対する切片 x n + 1 x_{n+1} x n + 1 であるから,
いま三点 ( x n , 0 ) , ( x n , f ( x n ) ) , ( x n + 1 , 0 ) (x_{n},0), (x_{n},f(x_{n})), (x_{n+1}, 0) ( x n , 0 ) , ( x n , f ( x n )) , ( x n + 1 , 0 )
の成す直角三角形について考えると,
f ′ ( x n ) = ( x n ) x n − x n + 1 f'(x_{n})=\frac{(x_{n})}{x_{n}-x_{n+1}} f ′ ( x n ) = x n − x n + 1 ( x n ) より
x n + 1 = x n − f ( x n ) f ′ ( x n ) x_{n+1}=x_{n}-\frac{f(x_{n})}{f'(x_{n})} x n + 1 = x n − f ′ ( x n ) f ( x n )
例えば 2 \sqrt{2} 2 を例にとると, x 2 = 2 ⇔ x 2 − 2 = 0 x^2=2\Leftrightarrow x^2-2=0 x 2 = 2 ⇔ x 2 − 2 = 0 なので
f ( x ) = x 2 − 2 , f ′ ( x ) = 2 x f(x)=x^2-2,f'(x)=2x f ( x ) = x 2 − 2 , f ′ ( x ) = 2 x とおいて x n − x n 2 − 2 2 x n x_{n}-\frac{x^2_{n}-2}{2x_{n}} x n − 2 x n x n 2 − 2 を計算すればよい.
なお f ′ ( x n ) f'(x_{n}) f ′ ( x n ) が 0 0 0 であると, ゼロ除算になってしまうため計算することができない.
この事実は, 傾きのない場合にどちらに進んでいけば良いのかわからないという直感的な考えにおいても筋が通る.
また, f ( x ) f(x) f ( x ) の解が複数あるとき, 初期値によっては望まない解が導かれることがある.
いま 2 \sqrt{2} 2 の正の解を得たいとき, 初期値を − 1 -1 − 1 で実行してしまうと,
得られる解は − 2 -\sqrt{2} − 2 となる.
直感的には決められた初期値の傾き f ′ ( x 0 ) f'(x_0) f ′ ( x 0 )
によって近づいていく方向が定まってしまうからといえる.
従って同手法を適用する際は, できる限り求めたい解に近い初期値を設定するのが望ましい.
なおニュートン法は 1 変数関数のみならず多変数関数に対しても同様にして解を求めることができる.
あまり厳密には書かないが, まずは簡単のために 2 変数の関数
f 1 ( x , y ) , f 2 ( x , y ) f_{1}(x,y),f_{2}(x,y) f 1 ( x , y ) , f 2 ( x , y ) を用いてそれを示すこととする.
f 1 ( x , y ) , f 2 ( x , y ) f_{1}(x,y),f_{2}(x,y) f 1 ( x , y ) , f 2 ( x , y ) は曲面の定義そのものであり,
この 2 つの曲面の交わる曲線を辿っていくことで解が求まる.
1 変数のニュートン法の場合と同様に漸化式を求めていけば,
多変数関数に対するニュートン法の漸化式も関数の値をその傾きで割る部分が出てくるが,
いま変数は複数であるので, 各方向への微小変化に対する変化量を求める必要がある.
これを求めるには全微分 をすればよいので, 結局
( x n + 1 , y n + 1 ) = ( x n , y n ) T − ∂ f ( x n , y n ) − 1 ( f 1 ( x n , y n ) , f 2 ( x n , y n ) ) T
(x_{n+1},y_{n+1})=(x_{n},y_{n})^T-{\partial f(x_{n},y_{n})}^{-1}(f_{1}(x_{n}, y_{n}),f_{2}(x_{n},y_{n}))^T
( x n + 1 , y n + 1 ) = ( x n , y n ) T − ∂ f ( x n , y n ) − 1 ( f 1 ( x n , y n ) , f 2 ( x n , y n ) ) T
ここで
∂ f ( x , y ) : = ( ∂ f 1 ( x , y ) ∂ x ∂ f 1 ( x , y ) ∂ y ∂ f 2 ( x , y ) ∂ x ∂ f 2 ( x , y ) ∂ y )
\begin{aligned}\partial f(x,y):=
\left(\begin{array}{cc}
\frac{\partial f_{1}(x,y)}{\partial x} & \frac{\partial f_{1}(x,y)}{\partial y} \\
\frac{\partial f_{2}(x,y)}{\partial x} & \frac{\partial f_{2}(x,y)}{\partial y}
\end{array}\right)
\end{aligned}
∂ f ( x , y ) := ( ∂ x ∂ f 1 ( x , y ) ∂ x ∂ f 2 ( x , y ) ∂ y ∂ f 1 ( x , y ) ∂ y ∂ f 2 ( x , y ) )
なお ∂ f ( x , y ) \partial f(x,y) ∂ f ( x , y ) はヤコビ行列といわれる.
実際にコンピュータで計算する際には, ∂ f ( x n , y n ) − 1 ( f 1 ( x n , y n ) , f 2 ( x n , y n ) ) T {\partial f(x_{n},y_{n})}^{-1}(f_{1}(x_{n}, y_{n}),f_{2}(x_{n},y_{n}))^T ∂ f ( x n , y n ) − 1 ( f 1 ( x n , y n ) , f 2 ( x n , y n ) ) T を求めるのは計算量と誤差の観点から見て困難なので,
∂ f ( x n , y n ) a = ( f 1 ( x n , y n ) , f 2 ( x n , y n ) ) T \partial f(x_{n},y_{n}){\boldsymbol a}=(f_{1}(x_{n}, y_{n}),f_{2}(x_{n},y_{n}))^T ∂ f ( x n , y n ) a = ( f 1 ( x n , y n ) , f 2 ( x n , y n ) ) T を LU 分解などで解き ( x n , y n ) T − a (x_n,y_n)^T-{\boldsymbol a} ( x n , y n ) T − a と解くことになる.
因みに, 上記で描画される接線は, 単純に ラグランジュの補完公式より
y − y 1 = y 2 − y 1 x 2 − x 1 ( x − x 1 ) y-y_{1}=\frac{y_{2}-y_{1}}{x_{2}-x_{1}}(x-x_{1}) y − y 1 = x 2 − x 1 y 2 − y 1 ( x − x 1 ) を用いて描いている.
具体的には接線の関数を g ( x ⋆ ) g(x^{\star}) g ( x ⋆ ) としたとき, 接点と y 2 = 0 y_{2}=0 y 2 = 0 であるときの 2 点 ( x , f ( x ) ) , ( x − f ( x ) f ′ ( x ) , 0 ) (x,f(x)),(x-\frac{f(x)}{f'(x)},0) ( x , f ( x )) , ( x − f ′ ( x ) f ( x ) , 0 ) を使って
g ( x ⋆ ) = f ( x ) f ( x ) f ′ ( x ) ( x ⋆ − x + f ( x ) f ′ ( x ) ) = f ′ ( x ) ( x ⋆ − x + f ( x ) f ′ ( x ) ) = f ′ ( x ) x ⋆ − f ′ ( x ) x + f ( x )
\begin{aligned}
g(x^{\star})&=&\frac{f(x)}{\frac{f(x)}{f'(x)}}(x^{\star}-x+\frac{f(x)}{f'(x)}) \\
&=&f'(x)(x^{\star}-x+\frac{f(x)}{f'(x)}) \\
&=&f'(x)x^{\star}-f'(x)x+f(x)
\end{aligned}
g ( x ⋆ ) = = = f ′ ( x ) f ( x ) f ( x ) ( x ⋆ − x + f ′ ( x ) f ( x ) ) f ′ ( x ) ( x ⋆ − x + f ′ ( x ) f ( x ) ) f ′ ( x ) x ⋆ − f ′ ( x ) x + f ( x )
と導ける.