17 votos

¿Por qué el error estándar de la intercepción de aumentar la ulterior $\bar x$ es de 0?

El error estándar de la intersección plazo ( $\hat{\beta}_0$ ) $y=\beta_1x+\beta_0+\varepsilon$ está dado por $$SE(\hat{\beta}_0)^2 = \sigma^2\left[\frac{1}{n}+\frac{\bar{x}^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\right]$$ donde $\bar{x}$ es la media de las $x_i$'s.

Por lo que entiendo, el SE cuantifica su incertidumbre - por ejemplo, en el 95% de las muestras, el intervalo de $[\hat{\beta}_0-2SE,\hat{\beta}_0+2SE]$ contendrá el verdadero $\beta_0$. No entiendo cómo la SE, una medida de la incertidumbre, aumenta con la $\bar{x}$. Si yo simplemente cambiar mis datos, de modo que $\bar{x}=0$ mi incertidumbre va hacia abajo? Que parece razonable.

Un análogo de la interpretación está en el descentrada versión de mis datos, $\hat{\beta}_0$ corresponde a mi predicción en $x=0$, mientras que en el centro de datos, $\hat{\beta}_0$ corresponde a mi predicción en $x=\bar{x}$. Así que ¿significa esto que mi incertidumbre acerca de mi predicción en $x=0$ es mayor que mi incertidumbre acerca de mi predicción en $x=\bar{x}$? Que parece muy razonable, el error de $\epsilon$ tiene la misma varianza para todos los valores de $x$, por lo que mi incertidumbre en mi los valores de predicción debe ser el mismo para todos los $x$.

Hay huecos en mi comprensión de lo que estoy seguro. Podría alguien ayudarme a entender lo que está pasando?

17voto

Sean Hanley Puntos 2428

Debido a que la línea de regresión de ajuste por mínimos cuadrados ordinarios necesariamente tendrá que ir a través de la media de los datos (es decir, $(\bar x, \bar y)$)--al menos mientras no suprimir la intersección: la incertidumbre sobre el verdadero valor de la pendiente no tiene ningún efecto sobre la posición vertical de la línea en la media de $x$ (es decir, en $\hat y_{\bar x}$). Esto se traduce en menos incertidumbre vertical en $\bar x$ que tiene más lejos de la $\bar x$. Si la intersección, donde$x=0$$\bar x$, entonces esto va a minimizar la incertidumbre sobre el verdadero valor de $\beta_0$. En términos matemáticos, esto se traduce en el menor valor posible de errores estándar para $\hat\beta_0$.

Aquí está un ejemplo rápido en R:

set.seed(1)                           # this makes the example exactly reproducible
x0      = rnorm(20, mean=0, sd=1)     # the mean of x varies from 0 to 10
x5      = rnorm(20, mean=5, sd=1)
x10     = rnorm(20, mean=10, sd=1)
y0      = 5 + 1*x0  + rnorm(20)       # all data come from the same  
y5      = 5 + 1*x5  + rnorm(20)       #  data generating process
y10     = 5 + 1*x10 + rnorm(20)
model0  = lm(y0~x0)                   # all models are fit the same way
model5  = lm(y5~x5)
model10 = lm(y10~x10)

enter image description here

Esta cifra es un poco ocupado, pero usted puede ver los datos de diferentes estudios en los que la distribución de $x$ estaba más cerca o más lejos de $0$. Las laderas difieren un poco de estudio a estudio, pero son en gran medida similares. (Aviso que ir todos a través de la letra X que he utilizado para marcar $(\bar x, \bar y)$.) No obstante, la incertidumbre sobre el verdadero valor de las pendientes de las causas de la incertidumbre acerca de la $\hat y$ a ampliar la más obtiene a partir de a $\bar x$, lo que significa que el $SE(\hat\beta_0)$ es muy amplia para los datos que fueron muestreados en el barrio de $x=10$, y muy estrecho para el estudio en el que los datos se tomaron muestras de cerca de $x=0$.


Edición en respuesta al comentario: Lamentablemente, centrando sus datos después de ellos no será de ayuda si usted desea saber la probabilidad de $y$ valor en algunos $x$$x_\text{new}$. En su lugar, usted necesita para centro de su recopilación de datos sobre el punto de atención en el primer lugar. Para entender estos temas de manera más completa, puede ayudar a leer mi respuesta aquí: regresión Lineal de predicción de intervalo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X