8 votos

¿Por qué esto es un barrio seguro para la convergencia uniforme de la secuencia define implícitamente una función?

Esta discusión se refiere a Teorema III-1.4 en C. H. Edwards, Jr Avanzadas de Cálculo de Varias Variables.

Estoy tratando de entender por qué el barrio se describe en la prueba del teorema de la función implícita es "seguro" para la convergencia de la asignación de contracción con la hipótesis inductiva para la secuencia :

$f_{n+1}[x]=f_{n}[x]-\frac{G[x,f_{n}[x]]}{D_{2}G[a,b]}$, $f_{0}[x]=b$.

El barrio está dada de la siguiente manera:

$\varepsilon\ge\lvert x-a\rvert\bigwedge\varepsilon\ge\lvert y-b\rvert\implies\lvert D_{2}G[x,y]-D_{2}G[a,b]\rvert\le\frac{1}{2}\lvert D_{2}G[a,b]\rvert$

$\varepsilon>\delta\ge\lvert x-a\rvert\implies\lvert G[x,b]\rvert\le\frac{1}{2}\varepsilon\lvert D_{2}G[a,b]\rvert$

A safe neighborhood for convergence. El gráfico muestra la traza sobre la superficie de la $\{x,y,G[x,y]\}$ de la plaza de $[a-\varepsilon,a+\varepsilon]\times[b-\varepsilon,b+\varepsilon]$ en verde.

El mayor $\delta$ restricción se indica en magenta, como es el la traza de la línea de $y=b$.

La traza de $x=a$ azul.

El blanco ángulo representa la proyección del punto de $\{a,b+\frac{\varepsilon}{2},\frac{\varepsilon}{2}D_{2}G[a,b]\}$.

$\frac{\varepsilon}{2}D_{2}G[a,b]$ también da la altura de la parte superior plano.

La solución real de la curva de $\{x,f[x],0\}$ es la intersección de la plano inferior y la superficie de la $\{x,y,G[x,y]\}$.

El rojo paralelogramo representa la condición de $G[a,y]=2(y-b)D_{2}G[a,y]$ lo que lleva a un bucle infinito. La elección de $\varepsilon$ evita que eso suceda en la curva azul. Esto se explica en mi respuesta a una pregunta anterior: Barrios necesaria para la convergencia de una secuencia.

Lo que estoy tratando de determinar es la razón por la que el rectángulo $[a-\delta,a+\delta]\times[b-\varepsilon,b+\varepsilon]$ es seguro para la convergencia de todas las $x\in[a-\delta,a+\delta]$. En otras palabras, ¿cómo se evita la condición de bucle infinito.

Un segundo diagrama muestra una simplificación de la representación del problema, utilizando una $G[x,y]$.

Editar para agregar: me olvidó mencionar un potencial significativo afirmación con respecto a la segunda imagen. El rectángulo en el que la imagen fue elegido de manera que la traza de la línea de segmento de $G[{c_1,d_1},{c_2,d_1}]$ está completamente por debajo del plano $z=0$, e $G[{c_1,d_2},{c_2,d_2}]$ está completamente por encima de la superficie de $z=0$. $D_2[x,y]>0$ tiene en todas partes en el rectángulo $[c_1,c_2]\times[d_1,d_2]$.

Simpler depiction of an implicitly determined function.

El objetivo es mostrar que el $f_{n+1}[x_*]=f_{n}[x_*]-\frac{G[x_*,f_{n}[x_*]]}{D_{2}G[a,b]}$ converge a un punto de la curva solución para todos los $x_*$ en un barrio dentro del rectángulo $[c_1,c_2]\times[d_1,d_2]$. El barrio descritos anteriormente se encuentran dentro de ese rectángulo.


Editar para agregar: Editar para modificar: observo que las porciones de la curva de color verde, con una constante $x$ nunca cruzan el plano de $z=0$ en el vecindario, por lo que es el derecho a excluir de ellos. A pesar de que el magenta curvas de hacer cruzan la solución de la curva, que no es una garantía de que lo harían con diferentes $G[x,y]$.


Editar para añadir: yo también tenga en cuenta que las hipótesis del teorema de sólo estipulan $G$$\mathscr{C}^1$. Que hace hablar acerca de los puntos de inflexión difícil. Pero parecen relevantes.

Parece apropiado para examinar lo que sucede en las condiciones extremas tales como:

$D_2G[x_*,y]=\frac{1}{2}D_2G[a,b]$,

$D_2G[x_*,y]=\frac{3}{2}D_2G[a,b]$

y

$\lvert D_{2}G[x,y]-D_{2}G[a,b]\rvert=\frac{1}{2}\lvert D_{2}G[a,b]\rvert$

Me he quitado mis propias especulaciones acerca de esas condiciones, porque creo que son demasiado restrictivas (IOW, malo).


Editar para agregar: Otra observación que parece importante es que todas las secuencias comienzan con la base del estado de $f_0[x]=b$. Estoy bastante seguro de que significa que todos los subsiguientes $f_n[x]$ va a estar en el mismo lado del plano de $y=b$$f_1[x]$.

Por desgracia no tengo un buen vocabulario exacto, ni la teoría de este dominio del problema. IOW, estoy mano saludando. Todo lo que estoy buscando en este momento es un intuitivamente satisfactoria explicación geométrica.


Editar para agregar: Un tercer gráfico muestra una vista lateral " de la situación, con la $x$ dimensión suprimida. Al colapsar el problema a la consideración de una familia de curvas en dos dimensiones que se ajustan a las condiciones establecidas, el problema se puede reducir a uno de los de análisis real.

Las líneas amarillas representan el rango de temperatura de pendientes para cualquier curva en el barrio, determinado por $\varepsilon\ge\lvert x-a\rvert\bigwedge\varepsilon\ge\lvert y-b\rvert\implies\lvert D_{2}G[x,y]-D_{2}G[a,b]\rvert\le\frac{1}{2}\lvert D_{2}G[a,b]\rvert$

El azul de la curva y la tangente de la línea de representar a un estado seguro. El rojo paralelogramo y acorde representar un bucle estado y de la pendiente de dos veces el bucle de la tangente, respectivamente. El verde de las líneas verticales representan el $y=\pm\varepsilon$. La vertical de la línea magenta segmento representa la restricción:

$\varepsilon>\delta\ge\lvert x-a\rvert\implies\lvert G[x,b]\rvert\le\frac{1}{2}\varepsilon\lvert D_{2}G[a,b]\rvert$.

Es decir, (creo) cada 2 dimensiones de la proyección de una curva debe intersectar la línea magenta segmento. Además, la base de la duración de cada secuencia es $f_0[x]=b$. La primera iteración es por lo tanto: $f_{1}[x]=b-\frac{G[x,b]}{D_{2}G[a,b]}$.

silhouette view

2voto

user445451 Puntos 199

Mira en la página 169 de la oit, en la sexta línea, por la frase que comienza por "Primera nota de que". Una pregunta clave que tengo para ti es: ¿está usted de acuerdo con la estimación, en la página 169 de la oit, que dice que, para todos los $y$ en el intervalo de $[b - \epsilon, b + \epsilon]$, tenemos$$|\phi'(y)| \le {1\over2}?$$If that estimate seems okay to you, then I think I can explain why the sequence$$f_1(x_*), \text{ } f_2(x_*), \text{ } f_3(x_*),\ldots$$converge, y, en particular, no entra en un bucle infinito.

Habría que responder a su pregunta?

Yo también debería estar claro acerca de las "órdenes de cuantificación", en Teorema 1.4, lo que podría explicar girando el teorema en un juego.

Me puede dar una función de $G$ y un punto de $(a, b)$ la satisfacción de las condiciones del teorema. Me daría un intervalo de $J$ y una función de $f: J \to \mathbb{R}$. Usted, a continuación, elija un punto de $x_*$$J$. Comprobamos si$$G(x_*, f(x_*)) = 0.$$Si sí, yo gano. Si no, usted gana.

Mi estrategia para ganar es dada en la prueba. El inicio de esta estrategia es elegir a $\epsilon$,$\delta$. Yo entonces, como mi movimiento,$$J := [a - \delta, a + \delta]$$and use contraction methods to define $f$, and give that to you as well. In the proof, I want to convince myself that, no matter which $x_*$ in $J$ you choose, the contraction method will yield $f(x_*)$ in such a way that$$G(x_*, f(x_*)) = 0.$$I think you may be concerned that, if $x_*$ is chosen too far away from $$, then the contraction method yields a sequence that does not converge, and possibly gets caught in an infinite loop. However, remember that, as part of my move in the game, I choose $\delta$, and then use it to define $J$.

Por lo tanto, limitada en donde puedes elegir a $x_*$.

Por lo tanto, si usted puede venir para arriba con un ejemplo (tal vez en las fotos) donde se ve un $x_*$ que lleva a un bucle infinito, puede ser que, como parte de mi estrategia en la elección de $J$, no me permite usar ese $x_*$.

Por lo que el teorema dice que por cada $G$ $(a, b)$ existe $J$ $f$ tal que, para cada $x_*$ en $J$,$$G(x_*, f(x_*)) = 0.$$It does not say that for every $G$ and $(a, b)$ and $x_*$ there exists $f$ such that$$G(x_*, f(x_*)) = 0.$$That is, in the game, you do not get to choose $x_*$ before I give you $J$.

El "para todos" y "no existe" son llamados cuantificadores. Orden de cuantificación es algo que a menudo causa confusión.

Yo no entiendo donde la contracción constante $k={1\over2}$ vino. Es un resultado directo de la selección de $\epsilon$. También entiendo que $\delta$ restringe aún más el intervalo en el que se $x$ vidas. Lo que yo no entiendo es por qué la elección de $\delta$ me protege de una condición de bucle. También estoy dudosa de la $\mathscr{C}^1$ hipótesis. Parece que la condición de bucle consiste en lo que yo considero que ser $\mathscr{C}^2$ propiedades. A saber, la inflexión.

¿Está usted de acuerdo que, para todos los enteros $n > 0$, para todos los $y$$[b - \epsilon, b + \epsilon]$,$f_{n+1}(y) = \phi(f_n(y))$?

Paso 1: Probar que $b$, $\phi(b)$, $\phi(\phi(b))$, $\phi(\phi(\phi(b)))$, $\ldots$ son todos los elementos de a $[b - \epsilon, b + \epsilon]$.

Paso 2: Probar que$$f_0(x_*) = b, \text{ }f_1(x_*) = \phi(b), \text{ }f_2(x_*) = \phi(\phi(b)), \text{ }f_3(x_*) = \phi(\phi(\phi(b))), \ldots$$etc.

Paso 3: Probar que la secuencia de$$b, \text{ }\phi(b), \text{ }\phi(\phi(b)), \text{ }\phi(\phi(\phi(b)))), \ldots$$es de Cauchy, y así es convergente y, en particular, no puede ser un no constante repetición de la secuencia. Es decir, no puede ser un "bucle infinito".

¿Está usted de acuerdo que, si puedo conseguir estos tres pasos demostrado, entonces hemos terminado?

Vamos a manejar el Paso 1.

Paso 1: Probar que $b$, $\phi(b)$, $\phi(\phi(b))$, $\phi(\phi(\phi(b)))$, $\ldots$ son todos los elementos de a $[b - \epsilon, b + \epsilon]$.

Si usted mira la tercera línea de la parte inferior de la página 168, see$$|G(x, b)| \le {1\over2}\epsilon |D_2G(a, b)|.$$This implies the following inequality:$$|\phi(b) - b| \le {1\over2}\epsilon.\tag*{$(1)$}$$Then, because $\phi$ is a ${1\over2}$-contraction, this implies the following inequality:$$|\phi(\phi(b)) - \phi(b)| \le {1\over4}\epsilon.\tag*{$(2)$}$$Then, because $\phi$ is a ${1\over2}$-contraction, this implies the following inequality:$$|\phi(\phi(\phi(b))) - \phi(\phi(b))| \le {1\over8}\epsilon.\tag*{$(3)$}$$Then, because $\phi$ is a ${1\over2}$-contraction, this implies the following inequality:$$|\phi(\phi(\phi(\phi(b)))) - \phi(\phi(\phi(b)))| \le {1\over{16}}\epsilon.\tag*{$(4)$}$$ Etc.

Por $(1)$,$$|\phi(b) - b | \le {1\over2}\epsilon < \epsilon,$$ por lo $\phi(b)$$[ b - \epsilon , b + \epsilon ]$.

Por $(1)$, $(2)$, y la desigualdad de triángulo,$$| \phi(\phi(b)) - b | \le {1\over2}\epsilon + {1\over4}\epsilon < \epsilon,$$ por lo $\phi(\phi(b))$$[ b - \epsilon , b + \epsilon ]$.

Por $(1)$, $(2)$, $(3)$, y el triángulo de la desigualdad, $$|\phi(\phi(\phi(b))) - b | \le {1\over2}\epsilon + {1\over4}\epsilon + {1\over8}\epsilon < \epsilon,$$ por lo $\phi(\phi(\phi(b)))$$[ b - \epsilon , b + \epsilon ]$. Etc.

Este finalice el Paso 1. (Déjeme saber si usted entiende. Si no, trate de punto de salida de la primera declaración que hice para que usted no puede ver que sigue a partir de sus declaraciones anteriores.)

Puedes buscar en el Paso 2, y ver si se puede averiguar? Basta con mirar cuidadosamente en las definiciones de $f_{n+1}$$\phi$. Si no tiene sentido, hágamelo saber y voy a escribir algo al respecto.

Ahora vamos a trabajar en el Paso 3.

Paso 3: Probar que la secuencia de$$b, \text{ }\phi(b), \text{ }\phi(\phi(b)), \text{ }\phi(\phi(\phi(b)))), \ldots$$es de Cauchy, y así es convergente y, en particular, no puede ser un no constante repetición de la secuencia. Es decir, no puede ser un "bucle infinito".

La secuencia$$b,\text{ }\phi(b),\text{ }\phi(\phi(b)),\text{ }\phi(\phi(\phi(b))), \text{ }\phi(\phi(\phi(\phi(b)))),\ldots$$is sometimes called the "forward orbit" of $b$ under $\phi$.

Una observación clave es que cada consecutivos distancia entre pares de puntos en cualquier órbita es menor o igual a ${1\over2}$ los tiempos de la anterior consecutivos distancia. Así que adelante cada órbita tiene geométricamente en descomposición consecutivos distancias. Dicha secuencia es siempre de Cauchy, por lo tanto convergente. Aquí está una explicación de por qué.

En primer lugar, tenga en cuenta que una secuencia puede no converger, aunque consecutivos distancias ir a cero. Por ejemplo, en la secuencia de los números reales$$1,\text{ } 1 + {1\over2}, 1 + {1\over2} + {1\over3}, 1 + {1\over2} + {1\over3}+ {1\over4}, \ldots$$ las distancias son consecutivos $${1\over2},\text{ }{1\over3},\text{ }{1\over4}, \ldots$$, que tiende a cero. Sin embargo, la secuencia no converge para cualquier número real, ya que es la secuencia de sumas parciales de la serie armónica, consulte el siguiente.

https://en.wikipedia.org/wiki/Harmonic_series_(matemáticas)

Por otro lado, si usted tiene una secuencia que ha geométricamente descomposición consecutivos distancias, como $$1, \text{ }1 + {1\over2},\text{ }1 + {1\over2} + {1\over4},\text{ }1 + {1\over2} + {1\over4} + {1\over8}, \ldots$$ entonces siempre es de Cauchy, por lo tanto convergente.

Por ejemplo, tenga en cuenta que si $i<j$, entonces la distancia entre el $i$th y $j$th términos de$$1, \text{ }1 + {1\over2},\text{ }1 + {1\over2} + {1\over4},\text{ }1 + {1\over2} + {1\over4} + {1\over8}, \ldots$$ es menor o igual a$$\left({1\over2}\right)^i + \ldots + \left({1\over2}\right)^{j-1},$$which is less than or equal to $({1\over2})^{i-1}$. When $i$ is large, $({1\over2})^{i-1}$ puede hacerse tan pequeño como quieras.

Déjame saber si esto tiene sentido. Si no, entonces por favor hágamelo saber la primera de las declaraciones que hago que no puede entender y voy a tratar de añadir detalle. Estoy dejando un montón aquí para que usted pueda averiguar, así que realmente no entiendo si necesita más explicación aquí y allá.

0voto

Sir Mild Puntos 48

El $\delta$ restricción en conjunción con el $\varepsilon$ restricción garantiza que $\varphi[b]=b-\frac{G[x_{*},b]}{D_{2}G[a,b]}\in[b-\varepsilon,b+\varepsilon]$. Por lo que la hipótesis de la contracción de asignación teorema están satisfechos. Esto es debido a que la altura máxima $\lvert G[x,b]\rvert=\frac{1}{2}\varepsilon\lvert D_{2}G[a,b]\rvert$ dividido por la mínima pendiente $\lvert D_{2}G[x,y]\rvert=\frac{1}{2}\lvert D_{2}G[a,b]\rvert$$\frac{\lvert G[x,b]\rvert}{\lvert D_{2}G[a,b]\rvert}=\frac{\frac{1}{2}\varepsilon\lvert D_{2}G[a,b]\rvert}{\frac{1}{2}\lvert D_{2}G[a,b]\rvert}=\varepsilon$.

Este no me dan la intuitivamente satisfactoria geométrica de la imagen que estoy buscando, pero creo que responde a la pregunta en el sentido matemático.


Editar para agregar una mejor explicación de cómo esto evita la condición de bucle.

La condición de bucle discutido aquí en los Barrios necesaria para la convergencia de una secuencia. es:

$2xf^{\prime}[x]=f[x]$.

Con el fin de evitarlo, requieren

$f^{\prime}[x]>\frac{f[x]}{2x}$.

La traducción que en términos de la discusión actual:

$\lvert D_{2}G[x_{*},y]\rvert\ge\frac{1}{2}\lvert D_{2}G[a,b]\rvert$ se corresponde con el mínimo $f^{\prime}[x]$.

$\lvert G[x_{*},b]\rvert\le\frac{1}{2}\varepsilon\lvert D_{2}G[a,b]\rvert$ se corresponde con la máxima $f[x]$.

La escritura de la anterior desigualdad en estos términos da

$\lvert D_{2}G[x_{*},y]\rvert>\frac{\lvert G[x_{*},b]\rvert}{2\lvert y-b\rvert}$.

La sustitución de los términos con sus valores de limitación da

$\frac{1}{2}\lvert D_{2}G[a,b]\rvert>\frac{\frac{1}{2}\varepsilon\lvert D_{2}G[a,b]\rvert}{2\varepsilon}$

$\lvert D_{2}G[a,b]\rvert>\frac{\lvert D_{2}G[a,b]\rvert}{2}$.

Para que el barrio se parece a salvo de los bucles.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X