Estoy tratando de entender el origen de la curva en forma de bandas de confianza asociado con un MCO de la regresión lineal y cómo se relaciona con los intervalos de confianza de los parámetros de regresión (pendiente y la ordenada al origen), por ejemplo (con R):
require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)
Parece que la banda está relacionada con los límites de las líneas calculado con el 2,5% de la intersección, y el 97.5% de pendiente, así como con el 97.5% de intercepción, y el 2.5% de pendiente (aunque no del todo):
xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))
Lo que no entiendo son dos cosas:
- ¿Qué acerca de la combinación de un 2,5% de la pendiente de 2,5% interceptar así como el 97,5% de pendiente y el 97,5% de intercepción? Estos dan líneas que están claramente fuera de la banda de trazados anteriormente. Tal vez no entiendo el significado de un intervalo de confianza, pero si en el 95% de los casos mis estimaciones están dentro del intervalo de confianza, estos parecen como un posible resultado?
- Lo que determina la distancia mínima entre el límite superior e inferior (es decir, cerca del punto donde las dos líneas se añade por encima de la intercepción)?
Supongo que ambas preguntas surgen porque no sé/comprender cómo estas bandas son realmente calculado.
¿Cómo puedo calcular los límites superior e inferior utilizando los intervalos de confianza de los parámetros de regresión (sin depender de predecir() o una función similar, es decir, con la mano)? Traté de descifrar el predecir.lm función en R, pero la codificación es más allá de mí. Agradecería cualquier punteros hacia la literatura relevante o explicaciones adecuadas para las estadísticas de los principiantes.
Gracias.