Nota: la captura de pantalla en la parte inferior es donde está mi pregunta viene.
Esta pregunta es bastante diferente de otras versiones de las condiciones de convergencia de la iteración de Newton. Por ejemplo, el teorema de Kantorovich.
Ahora estoy analizando el método de Newton-Raphson iteración en general de los espacios de Banach $E,F$. Deje $x_0\in E$, y deje $f:B_t(x_0)\to F$ ser una función derivable. ($B$ denota una bola abierta con el radio de $t$.) $L(E,F)$ es el conjunto de los lineales de asignación de $E$ a $F$.
Por definición, $f$ es diferenciable en $x$ con derivados $Df_x\in L(E,F)$ (que es lineal y funcional de $E$ a $F$) si $\exists r(h),f(x+h)=f(x)+Df_x(h)+r(h)$, donde $r(h)/\|h\|\to 0$ como $h\to 0$.
Para hacerlo simple, puedo asumir que existe $s>0$ tales que
- $\|f(x_0)\|\leq t/(2s)$
- Si $x,y\in B_t(x_0)$ entonces $\|Df_x-Df_y\|\leq 1/(2s)$
- $\forall x\in B_t(x_0),\exists J_x\in L(F,E)$ tal que $J_xDf_x=Df_xJ_x=I_E$ e $\|J_x\|\leq s$.
Ahora vamos a trabajar en la iteración. Vamos a arreglar $x\in B_t(x_0)$. Set $x_n=x_{n-1}-J_x(f(x_{n-1}))$. En el curso de análisis real, a menudo tomamos $x=x_{n-1}$, pero aquí tengo que arreglar $x$ a ser nada en $B_t(x_0)$. Suponga por un momento que $\forall x\in B_t(x_0)$. Voy a explicar por qué más adelante.
En primer lugar, he de mostrar que $x_n$ converge. Ahora puedo usar la desigualdad $$ \|f(a)-f(b)-T(a-b)\|\leq \|a-b\|\sup_{c\in [a,b]} \|Df_c-T\|, $$ donde $[a,b]$ es el segmento de la línea de unirse a $a,b$, e $T\in L(E,F)$.
El uso de esta desigualdad, definimos $g(y)=J_x(f(y))$, lo $x_n=x_{n-1}-g(x_{n-1})$, e $Dg_y=J_xDf_y$.(La razón por la que no pueden establecer $x=x_{n-1}$ es que si lo hago de esa manera, entonces $g(y)=J_y(f(y))$, y no puedo encontrar la derivada de $g$ en este caso). Desde $x$ es fijo, se puede asumir que NO hay $x$ dependencia en $g$. Por lo tanto, $$ \|x_{n+1}-x_{n}\|=\|f(x_{n})-f(x_{n-1})-(x_{n}-x_{n-1})\|\\ \leq \|x_{n}-x_{n-1}\|\sup_{c\in [x_n,x_{n-1}]} \|Dg_c-I\|\\=\|x_{n}-x_{n-1}\|\sup_{c\in [x_n,x_{n-1}]} \|J_xDf_c-J_xDf_x\|\\ \leq \|x_{n}-x_{n-1}\|\|J_x\|\|Df_c-Df_x\|\\ \leq \frac{1}{2} \|x_{n}-x_{n-1}\|. $$ También, $$ \|x_1-x_0\|=\|J_x(f(x_0))\|\leq t/2 $$ La conclusión es $\|x_n-x_{n-1}\|\leq t/2^n$.
Mi pregunta: ¿es realmente bien dejar que $x$ ser cualquier cosa fija en $B_t(x_0)$? ¿Realmente funcionan? Si es malo, ¿cómo puedo solucionarlo?
Para demostrar que $f(x_n)$ converge a cero, siento que debo probar algo como $\|f(x_n)\|\leq t/(2^{n+1}s)$(propuesto en un libro de análisis real). Yo trate de comenzar con este: $$ \|f(x_n)\|\leq \|Df_x\|\|x_{n+1}-x_n\| $$ pero no va a ninguna parte. De $\|J_x\|\leq s$ no podemos obtener una cota superior de a $Df_x$.
Entonces, ¿cómo puedo demostrar $\|f(x_n)\|\leq t/(2^{n+1}s)$?
Debe quedar claro que $x_n$ es una secuencia de Cauchy - pero podría no converger en $B_t(x_0)$ - es eso un problema?
Es una pregunta larga, así que si he cometido errores por favor señalarlo.
Por favor, mire la captura de pantalla siguiente si la anterior no es clara.
Origen de mi problema: Un curso de análisis matemático(captura de pantalla)
Aquí es un teorema de Kantorovich que está relacionado pero no es el mismo.