4 votos

¿Regresiones polinomiales tienen mayor varianza al final?

En la lectura del libro "Una Introducción a la Estadística de Aprendizaje con Aplicaciones en R", me encontré con este gráfico:

enter image description here

Se muestra que el punto de sabios de la varianza es mayor en los extremos de la curva de regresión. ¿Por qué es eso? Pensé que la varianza puede ser mayor, porque parece ser que hay pocos puntos de datos cerca del final, pero el se calcula la varianza de los coeficientes, por lo que el número de puntos de datos utilizados en la estimación no tiene ningún impacto. Entonces pensé que la varianza es mayor debido a que los valores de X son más grandes, pero el gráfico de la izquierda muestra un ligero incremento en la varianza en ambos lados (incluso cuando X es pequeño).

En general, he leído que los polinomios tienen notorio final comportamientos - ¿qué hace esto?

Gracias.

1voto

Bey Puntos 1928

Es esencialmente debido a los métodos de Runge del Fenómeno de la interpolación de polinomios. Incluso sin la incertidumbre, el comportamiento de los polinomios de orden superior en sus extremos es muy sensible a los valores de los parámetros.

Aquí hay un enlace a una explicación técnica que voy a regurgitar aquí. Se relaciona Runge del Fenómeno de regresión. A continuación es un intuitivo, pero es cierto que no rigurosa explicación.

Una buena manera de pensar acerca de esto es que, para ser un buen ajuste a los datos de la muestra (es decir, no veer completamente fuera del rango de los datos), es necesario equilibrar las aportaciones de los términos de orden superior usando los términos de orden inferior. Un desequilibrio en este en el rango de la función dará como resultado un mal ajuste, por lo menos plazas que requiere cada vez más exigentes "tuning" como añadir más términos polinomiales. Por lo tanto, los pequeños errores resultado en los extremos "meneando", mucho más que el centro de la función. Esto es especialmente grave si usted no tiene una gran cantidad de datos en los bordes de su intervalo.

Esto no es totalmente riguroso, pero es de esperar que se muestra de forma intuitiva por qué esto sería así. Los detalles vendría de la realidad calcular el CI de los límites, pero no creo que sea tan informativa para la intuición.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X