33 votos

Intuición del estimador sándwich

Wikipedia y el paquete sándwich de R viñeta ofrecen buena información sobre los supuestos en los que se basan los errores estándar de los coeficientes MCO y los fundamentos matemáticos de los estimadores sándwich. Sin embargo, sigo sin tener claro cómo se aborda el problema de la heteroscedasticidad de los residuos, probablemente porque no entiendo del todo la estimación estándar de la varianza de los coeficientes MCO.

¿Cuál es la intuición que subyace al estimador "sandwich"?

5 votos

Necesita saber más sobre $M$ -(o estimación de extremos, como se denomina a veces en econometría). El estimador sándwich para la regresión no es más que un caso especial de una fórmula muy general del método delta, y si entiende esta última, no tendrá ningún problema con la primera. No hay ninguna intuición en que el estimador sándwich no intenta modelizar la heteroscedasticidad ni hace nada específico al respecto; es sólo un estimador de varianza diferente que funciona bajo un conjunto de supuestos más general que el estimador estándar MCO.

0 votos

@StasK ¡Gracias! ¿Conoces algún buen recurso en particular sobre fórmulas de estimación M y método delta?

0 votos

Merece la pena echar un vistazo a la monografía de @Robert Huber "Robust Statistics".

28voto

alexs77 Puntos 36

Para OLS, puede imaginarse que está utilizando la varianza estimada de los residuos (bajo el supuesto de independencia y homocedasticidad) como una estimación de la varianza condicional de la variable $Y_i$ s. En el estimador basado en sándwich, está utilizando los residuos cuadrados observados como una estimación complementaria de la misma varianza que puede variar entre las observaciones.

\begin{equation} \mbox{var}\left(\hat{\beta}\right) = \left(X^TX\right)^{-1}\left(X^T\mbox{diag}\left(\mbox{var}\left(Y|X\right)\right)X\right)\left(X^TX\right)^{-1} \end{equation}

En la estimación del error estándar por mínimos cuadrados ordinarios para la estimación del coeficiente de regresión, la varianza condicional del resultado se trata como constante e independiente, para que pueda estimarse de forma coherente.

\begin{equation} \widehat{\mbox{var}}_{OLS}\left(\hat{\beta}\right) = \left(X^TX\right)^{-1}\left(r^2X^TX\right)\left(X^TX\right)^{-1} \end{equation}

Para el sándwich, evitamos la estimación coherente de la varianza condicional y, en su lugar, utilizamos una estimación complementaria de la varianza de cada componente utilizando el residuo al cuadrado

\begin{equation} \widehat{\mbox{var}}_{RSE}\left(\hat{\beta}\right) = \left(X^TX\right)^{-1}\left(X^T\mbox{diag}\left(r_i^2\right)X\right)\left(X^TX\right)^{-1} \end{equation}

Utilizando la estimación de la varianza del complemento, obtenemos estimaciones coherentes de la varianza de $\hat{\beta}$ por el Teorema del Límite Central de Lyapunov.

Intuitivamente, estos residuos al cuadrado observados absorberán cualquier error inexplicado debido a la heteroscedasticidad que, de otro modo, habría sido inesperado bajo el supuesto de varianza constante.

1 votos

Es tu último párrafo el que me cuesta entender. ¿Puede ilustrarlo?

0 votos

No es SE en tus fórmulas, AdamO, es SE^2... en el sentido matricial que quieras darle.

0 votos

@StasK Buena observación. Quizás sea mejor un variance-hat. Estaba confundiendo terminología multivariante y univariante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X