Estoy estudiando sobre el método de Newton y tengo la sola dimensión caso perfectamente, pero multidimensional de la versión me hace la pregunta...
En Wikipedia método de Newton en las dimensiones superiores se define como:
$$\textbf{x}_{n+1} = \textbf{x}_n - [Hf(\textbf{x}_n)]^{-1}\nabla f(\textbf{x}_n), \;\;\; n \geq 0.$$
Donde $\textbf{x}_n$ $p$- dimensiones del vector en $n$th iteración, $[Hf(\textbf{x}_n)]^{-1}$ es la inversa de la matriz Hessiana de la función de $f(\textbf{x})$ $\textbf{x}_n$ $\nabla f(\textbf{x}_n)$ es el gradiente de la función de $f(\textbf{x})$$\textbf{x}_n$. Que es:
$$\left( \begin{array}{c} x_1^{(n+1)} \\ x_2^{(n+1)} \\ \vdots \\ x_p^{(n+1)} \end{array} \right) = \left( \begin{array}{c} x_1^{(n)} \\ x_2^{(n)} \\ \vdots \\ x_p^{(n)} \end{array} \right) - \left( \begin{array}{cccc} \frac{\partial^2f}{\partial x_1^2}(\textbf{x}_n) & \dots & \dots &\frac{\partial^2f}{\partial x_p\partial x_1}(\textbf{x}_n)\\ \frac{\partial^2f}{\partial x_1\partial x_2}(\textbf{x}_n) & \ddots & \vdots & \vdots\\ \vdots & \vdots & \vdots & \vdots\\ \frac{\partial^2f}{\partial x_1\partial x_p}(\textbf{x}_n) & \dots & \dots & \frac{\partial^2f}{\partial x_p^2}(\textbf{x}_n) \end{array} \right)^{-1}\left( \begin{array}{c} \frac{\partial f}{\partial x_1}(\textbf{x}_n) \\ \frac{\partial f}{\partial x_2}(\textbf{x}_n) \\ \vdots \\ \frac{\partial f}{\partial x_p}(\textbf{x}_n) \end{array} \right)$$
Ahora mi pregunta es: "¿Qué es la intuición detrás de esta fórmula?" Esto se asemeja de alguna manera el gradiente algoritmo de descenso, pero a la inversa de la de Hess es como si viniera de la chistera :S ¿alguien me da un tipo similar de la prueba como se da aquí en el caso unidimensional:
¿Por qué el método de Newton trabajo?
¿Por qué el estado de Hesse? Por qué su inversa?! :) La intuición de la fórmula?
Gracias por la ayuda :) P. S. I aquí es la página llegué a la fórmula anterior:
http://en.wikipedia.org/wiki/Newton%27s_method_in_optimization#Higher_dimensions
Tenga en cuenta también que en mi notación de la topscript en el $x_i$s no significa exponente, es sólo una iteración de la etiqueta...