Creo que entiendo cómo utilizar los polinomios de Taylor para aproximar el seno. Por ejemplo, si $$ \sin x \approx ax^2+bx+c $$ y queremos que la aproximación sea especialmente precisa cuando $x$ está cerca de $0$ entonces podríamos adoptar el siguiente enfoque. Cuando $x=0$ , $\sin x = 0$ y así $ax^2+bx+c=0$ lo que significa que $c=0$ . Por lo tanto, obtenemos $$ \sin x \approx ax^2+bx $$ Si queremos que las primeras derivadas coincidan, entonces $\frac{d}{dx}(ax^2+bx)$ debe ser igual a $1$ . Por lo tanto, $b=1$ : $$ \sin x \approx ax^2+x $$ Por último, si queremos que las segundas derivadas coincidan, entonces $\frac{d^2}{dx^2}(ax^2+x)$ debe ser igual a $0$ y así $a=0$ . La aproximación del ángulo pequeño para el seno es $$ \sin x \approx x $$ Todo esto tiene sentido para mí. Lo que no entiendo es cuando la gente trata de poner esto en pie de rigor. A menudo he oído decir a la gente que "esto demuestra que $x$ es la mejor aproximación cuadrática de $\sin x$ cuando $x$ está cerca de $0$ '. Pero, ¿qué se entiende por "mejor" y por "más cercano"? Si la aproximación se volviera repentinamente terrible cuando $x=0.5$ Entonces, ¿se consideraría esto lo suficientemente cerca de $0$ para que haya un problema? Parece que hay definiciones formales para estos términos, pero no sé cuáles son.
Respuestas
¿Demasiados anuncios?Dada una función $f$ , polinomios $p_1$ y $p_2$ y algunos $x_0$ podemos definir "mejor" en el sentido de que existe una vecindad en la que es una mejor aproximación. Es decir, si existe $\epsilon$ tal que $(|x-x_0|<\epsilon) \rightarrow (|p_1(x)-f(x)|<|p_2(x)-f(x)|)$ , entonces cerca de $x_0$ , $p_1$ es una mejor aproximación a $f$ que $p_2$ es.
Así que los polinomios de Taylor pueden, con esta definición, decirse que son mejores que cualquier otro polinomio del mismo orden. Es decir, si $f$ es analítico y $T_n$ es el $n$ polinomio de Taylor de orden de $f$ , entonces para todos los $n$ polinomios de orden $g$ existe una vecindad alrededor de $x_0$ tal que $T_n$ es mejor que $g$ .
Creo que, en el ámbito de la aproximación de funciones, hay que distinguir dos casos
- alrededor de un punto
- en un rango
En el caso de $\sin(x)$ , si tenemos en cuenta que es una función impar, seguro que alrededor de $x=0$ sólo se utilizarán términos Impares y la mejor aproximación cuadrática será algo así como $k x$ y si queremos matematizar la pendiente en $x=0$ Tendremos $k=1$ .
Ahora, olvídate de las propiedades de $\sin(x)$ y decir que se quiere la mejor aproximación cuadrática entre $x=0$ y $x=\frac \pi 6$ . Por lo tanto, considere la norma $$\Phi=\int_0^{\frac \pi 6} \Big[a+b x+c x^2-\sin(x)\big]^2\,dx$$ Me saltaré los cálculos intermedios y el mínimo de $\Phi$ se obtendrá para $$a=-\frac{9 \left(1440-720 \sqrt{3}-48 \pi -6 \pi ^2+\sqrt{3} \pi ^2\right)}{\pi ^3}\approx -0.00116136$$ $$b=\frac{432 \left(1080-540 \sqrt{3}-42 \pi -3 \pi ^2+\sqrt{3} \pi ^2\right)}{\pi ^4}\approx 1.02675$$ $$c=-\frac{3240 \left(864-432 \sqrt{3}-36 \pi -2 \pi ^2+\sqrt{3} \pi ^2\right)}{\pi ^5}\approx -0.128777$$ Esto daría $\Phi=9.91 \times 10^{-8}$ mientras que el ajuste $b=1$ y $a=c=0$ En ese rango, la norma sería $\Phi=4.19 \times 10^{-5}$ .
Prueba esto. Gráfico $y = e^x - (x + 1).$ Obtendrás lo que parece ser una parábola cerca de $x=1.$ Por supuesto, no es realmente una parábola. De hecho, sería absolutamente sorprendente que la función trascendental $e^x - x - 1$ tenía la geometría exacta enfoque y directriz propiedad que tiene una verdadera parábola. Pero parece bastante claro (esto no es una prueba, por supuesto, ya que sólo estamos viendo una imagen) que la tangente en $x=0$ de este gráfico es horizontal. Suponiendo esto, significa que la tangente a la gráfica de $y = e^x - (x + 1) + 0.01x$ será $y = 0.01x.$ ¿Por qué? Cuando estamos muy cerca de $x=0,$ esencialmente estamos añadiendo el gráfico de la $x$ -a la gráfica de $y = 0.01x.$ Y por supuesto, si usted mira un gráfico de $y = e^x - (x + 1) + 0.01x$ , entonces verás que cerca de $x=0$ el gráfico es lineal y no horizontal (esto se puede decir sin tratar de determinar si es realmente $y = 0.01x$ en lugar de posiblemente alguna otra línea no horizontal), lo que significa que los cambios en $y$ son proporcionales (por una constante no nula) a los cambios en $x,$ algo que NO era cierto para el gráfico de $y = e^x - (x+1).$
Ayudará a investigar, por sí mismo, los gráficos de $y = e^x - (x + 1) + ax$ para varios valores de $a \neq 0.$ En todos estos casos se debe encontrar que el gráfico cruza el $x$ -en un ángulo distinto de cero, aunque cuando $a$ está cerca de $0$ es posible que tengas que hacer un poco de zoom para ver esto.
Esta investigación sugiere que, entre todas las funciones lineales posibles (por "lineales", quiero decir "algebraicas de grado como máximo $1),$ el que MEJOR se aproxima $e^x$ en las proximidades de $x=0$ es $Ax + B$ para $A = 1+a$ y $B = 1,$ donde $a = 0.$ [En realidad no hemos mirado lo que pasa si $B \neq 1.$ Debería ser fácil ver lo que ocurre si $B \neq 1,$ independientemente de cómo intentemos variar el coeficiente de $x$ para arreglar las cosas].
Normalmente, el siguiente paso, cuando se presenta a los estudiantes una investigación como ésta, es considerar qué término cuadrático podríamos añadir para obtener una mejor aproximación. Pero antes de hacerlo, veamos un ajuste intermedio de la aproximación $1 + x,$ uno de la forma $1 + x + a|x|^{1.3},$ para varios valores de $a.$ La razón por la que estoy usando $|x|$ es para evitar problemas con los sistemas de álgebra computacional que tratan de interpretar todo para los números complejos. Verás que cerca de $x=0$ no importa el valor de $a$ es. Consideremos, por ejemplo, el gráfico de (1) $y = e^x - (1 + x) + 2|x|^{1.3}$ y la gráfica de (2) $y = e^x - (1 + x) + 42|x|^{1.3}$ . No parece haber distinción cualitativa entre (1) las diferencias de los valores de $e^x$ y los valores de $1 + x + 2|x|^{1.3}$ y (2) las diferencias de los valores de $e^x$ y los valores de $1 + x + 42|x|^{1.3}.$ Por supuesto, para ser más convincente (aún no es una prueba, sin embargo), usted querrá acercarse a $x=0$ para ver si esta aparente similitud entre (1) y (2) se mantiene. Además, si se prueban valores negativos de $a,$ entonces verá que el gráfico está por debajo del $x$ -pero las características cualitativas son las mismas. Al estar por debajo del $x$ -para valores negativos de $a$ sólo significa que cuando $a < 0$ y estamos cerca de $x=0,$ los valores de $e^x$ son menos de los valores de $1 + x + a|x|^{1.3}.$
Repasemos un poco las cosas. Primero, $1 + x$ es la mejor aproximación lineal a $e^x$ en el sentido de que, como $x$ se acerca a $0,$ los errores son menores que $ax$ para cualquier $a \neq 0.$ El párrafo anterior parece mostrar que no obtenemos ningún beneficio sustancial al considerar ajustes de la forma $a|x|^{1.3},$ ya que el efecto de ajustar $1 + x$ añadiendo $a|x|^{1.3}$ parece producir gráficos que se parecen a $a|x|^{1.3}.$
Si se repite la investigación anterior para otras posibilidades de la forma $1 + x + a|x|^{b},$ donde $1 < b < 2,$ entonces encontrarás que esencialmente ocurre lo mismo --- no hay una única aproximación BEST para estos exponentes, en el sentido de que NO hay un valor único de $a$ (para cualquier especificación previa $b)$ que da una aproximación cualitativamente mejor que todos los demás valores de $a.$
La situación cambia bruscamente si utilizamos $b=2.$ Consideremos los gráficos de $y = e^x - (1 + x - 2x^2)$ y $y = e^x - (1 + x + 5x^2)$ . En cada caso, las gráficas aparecen cuadráticas cerca del origen, lo que sugiere que los errores son proporcionales a $x^2,$ lo que no es cualitativamente diferente de utilizar simplemente la aproximación $1 + x.$ Si experimentas cambiando el coeficiente de la cuadrática, encontrarás lo mismo hasta que por casualidad pruebes el valor mágico $1/2.$ El gráfico de $y = e^x - (1 + x + \frac{1}{2}x^2)$ parece ser cúbico cerca de $x=0.$
Para terminar, porque esto se está alargando mucho más de lo que realmente tenía tiempo (empezó como un comentario), $1 + x + \frac{1}{2}x^2$ es la mejor aproximación cuadrática a $e^x$ en el sentido de que, para funciones de la forma $ax^2 + bx + c,$ no conseguirá que los errores sean menores que los cuadráticos (en $x)$ como $x$ se acerca a $0$ a menos que elija $a = \frac{1}{2}$ y $b = 1$ y $c = 1.$ Si no tiene $c=1,$ entonces habrá un error de "orden cero" (es decir, los errores serán proporcionales a $x^0$ en el límite como $x \rightarrow 0).$ Y si $c=1,$ pero no tienes $b = 1,$ entonces habrá un error de "primer orden" (es decir, los errores serán proporcionales a $x^1$ en el límite como $x \rightarrow 0).$ Y por último, si $c=1$ y $b=1,$ pero no tienes $a = \frac{1}{2},$ entonces habrá un error de "segundo orden" (es decir, los errores serán proporcionales a $x^2$ en el límite como $x \rightarrow 0).$ Sin embargo, si $c=1$ y $b=1$ y $a=\frac{1}{2},$ entonces el error será proporcional a $x^3$ (y no sólo a un orden intermedio de pequeñez, como $x^{2.3}$ o $x^{2.87})$ en el límite como $x \rightarrow 0.$
En cuanto a la situación con $\sin x,$ lo que ocurre es que no sólo se $x$ la mejor aproximación lineal, pero de hecho $x$ es también la mejor aproximación cuadrática. Es decir, la mejor aproximación cuadrática es $x + 0x^2.$ Y si miras el gráfico de $\sin x - x$ Verás que se parece a $x^3$ cerca de $x=0.$
Voy a terminar con esta pregunta. ¿Cómo es que, una vez que damos con la mejor aproximación cuadrática, la única manera de conseguir una mejor aproximación es considerar ajustes cúbicos? Es decir, ¿por qué no tenemos la mejor $x^b$ aproximaciones para valores no enteros de $b$ ? O dicho de otro modo, ¿es posible que el error entre una función y su mejor aproximación cuadrática NO sea proporcional a $x^3$ como $x \rightarrow 0,$ sino que sea un poco más tarde, por ejemplo, que sea proporcional a $x^{2.71}$ como $x \rightarrow 0$ ? En resumen, ¿qué hay detrás de estos saltos de exponente, que uno podría ver como análogo a saltos cuánticos en la energía de los electrones en los átomos ? (Respuesta: Tiene que ver con la $C^n$ supuestos de suavidad en el teorema de Taylor).
Esto parece una pregunta de aproximación asintótica en la que buscamos $$ f(x)=a_0+a_1x+a_2x^2+\cdots+a_nx^n+o\!\left(x^n\right)\tag1 $$ como $x\to0$ . $(1)$ significa que tenemos $$ \lim_{x\to0}\frac{f(x)-\left(a_0+a_1x+a_2x^2+\cdots+a_nx^n\right)}{x^n}=0\tag2 $$ Si $f$ se comporta bien cerca de $0$ (por ejemplo analítica real ), el polinomio de Taylor de grado $n$ satisface $(2)$ .
Para su ejemplo de $\sin(x)\approx x$ tenemos $$ \lim_{x\to0}\frac{\sin(x)-x}{x^2}=0 $$ pero $$ \lim_{x\to0}\frac{\sin(x)-x}{x^3}=-\frac16 $$ Así, $\sin(x)\approx x$ sólo sirve para el segundo orden. Es el polinomio más cercano de grado $2$ o menos cuando $x$ está cerca $0$ .
$$ \cos x = 1 - \frac {x^2} 2 + \text{higher-degree terms}. $$ Decir que esto da la mejor aproximación a $\cos x$ por un polinomio cuadrático cercano a $x=0$ significa que para cualquier otro polinomio cuadrático, existe algún intervalo abierto que contiene $0$ dentro del cual este polinomio da mejores aproximaciones al coseno. Lo pequeño que debe ser ese intervalo abierto depende de cuál sea el otro polinomio.
Por ejemplo, dejemos que $a= (1-\cos(0.05))/0.05^2.$ Entonces $1 - a\cdot0.05^2$ es exactamente igual a $\cos(0.05),$ pero si $-0.03<x<0.03$ se obtienen mejores aproximaciones a $\cos x$ utilizando $1 - \tfrac 1 2 x^2$ que utilizando $1-ax^2.$
- Ver respuestas anteriores
- Ver más respuestas