Véase la sección 6-4a de Wooldridge (2020), Introducción a la econometría: Un enfoque moderno , 7ed, Cengage.
Varianza del error de predicción
No es $\sigma^2 [ 1/n + (x_j-\bar{x})^2 / \sum_i (x_i - \bar{x})^2 ]$ .
Para la expresión correcta, permítanme utilizar las notaciones vectoriales. El modelo es $y=x\beta + u$ , donde $x=(1,pop)$ . Sea $x_0 = (1,1029)$ . El valor a predecir ( $y_0$ ) aún no está etiquetado. El predictor es $\hat\theta = x_0 \hat\beta$ , donde $\hat\beta$ es el estimador OLS, y la etiqueta a predecir es $x_0 \beta + u_0$ . Por lo tanto, el error de predicción es $y_0 - \hat\theta = u_0 - x_0 (\hat\beta-\beta)$ .
Como $\hat\beta$ es una función de la muestra y $u_0$ (fuera de la muestra) se supone independiente de la muestra, la varianza del error de predicción es $\sigma^2 + x_0 V(\hat\beta) x_0'$ , donde $'$ significa transposición. Como $V(\hat\beta) = \sigma^2 (X'X)^{-1}$ , donde $X$ es la matriz de características (incluyendo el término constante de la primera columna), la varianza del error de predicción es $\sigma^2 [ 1+ x_0 (X'X)^{-1} x_0' ]$ por lo que el error estándar es $$\sigma \sqrt{1 + x_0 (X'X)^{-1} x_0'}.$$
Cálculo del se(error de predicción)
Si cambiamos la variable $pop$ a $pop-1029$ entonces $\hat\theta$ se presenta como la estimación del intercepto:
/* Stata */
gen pop2 = pop - 1029
reg fuel pop2
Se ve que el modelo reparametrizado $fuel = \theta + \beta_1 (pop-1029) + u$ da $\theta = \beta_0 + 1029 \beta_1$ por lo que el estimador de intercepción $\hat\theta$ es su predictor.
Sin embargo, el error estándar reportado es $se(\hat\theta) = \hat\sigma \sqrt{x_0 (X'X)^{-1} x_0'}$ , no el deseado $\hat\sigma \sqrt{1+x_0 (X'X)^{-1} x_0'}$ . Para la correcta, basta con calcular $\sqrt{\hat\sigma^2 + se(\hat\theta)^2}$ .
1 votos
¿Cómo cambiaría el resultado de la regresión si, por ejemplo, se añadiera $10^6$ a cada
pop
valor y añadir $-0.0116584\times 10^6$ a cadafuel
¿valor? Intuitivamente, eso desplaza los datos lejos depop=1029
sin alterar la línea de regresión y, por tanto, debería dar lugar a un intervalo de predicción mucho más amplio. Eso significa que puede centrar su investigación en los elementos de la salida que cambian. (Incluso si no tienes los datos reales, puedes inventarte algunos y ejecutar ambas regresiones para ver qué ocurre).1 votos
Muchas gracias. Sólo cambia el error estándar del intercepto (por tanto, t, valor p e IC). Esto me inspiró para averiguar que $Var(\hat{\beta}_0)=\sigma^2(1/n+\bar{x}^2/SXX)$ , entonces puedo conseguir $\bar{x}$ para calcular el error estándar de predicción.
1 votos
El error estándar de un valor previsto no es lo que has dicho. Lo que tienes ahí es el error estándar para la media en un determinado $x$ .
0 votos
Lo siento, sólo he seguido la descripción de la opción
stdp
enStata
. Puede considerarse como el error estándar del valor esperado predicho, la media o el valor ajustado.