Mi profesor dijo: "Las violaciones del supuesto de homoscedasticidad no conducen a un sesgo en el coef estimado". ¿Puede alguien motivar/explicar esto, quizás con una fórmula?
Respuesta
¿Demasiados anuncios?En un modelo de regresión lineal en notación matricial se tiene $y = X \beta + \varepsilon$ . Suponiendo una matriz de regresores no estocástica $X$ y un error de media cero, es decir, $E(\varepsilon) = 0$ se obtiene la siguiente expectativa de respuesta:
$E(y) = E(X \beta + \varepsilon) = E(X \beta) + E(\varepsilon) = X\beta + 0 = X \beta$ .
Puede dividir la expectativa debido a su linealidad y luego utilizar sus supuestos (no estocástico $X$ y media cero $\varepsilon$ ).
Y luego quieres establecer la insesgadez del estimador de mínimos cuadrados:
$\hat \beta = (X^\top X)^{-1} X^\top y$ .
Así que simplemente se toma la expectativa de nuevo, utilizando el no-estocástico $X$ y la expectativa de $y$ derivada de la anterior:
$E(\hat \beta) = E((X^\top X)^{-1} X^\top y) = (X^\top X)^{-1} X^\top E(y) = (X^\top X)^{-1} X^\top X \beta = I \beta = \beta$ , donde $I$ es la matriz de identidad.
Así que ves que para establecer $E(\hat \beta) = \beta$ sólo se necesita la suposición de que $\varepsilon$ tiene una media cero, pero no tiene que ser homocedástica, etc. Esto funciona porque tanto el operador de expectativas como el modelo son lineales.
Si los regresores $X$ son estocásticos, se pueden derivar esencialmente las mismas ecuaciones al tomar las expectativas condicionales (dadas $X$ ). Pero además hay que suponer que las columnas de $X$ y $\varepsilon$ no están correlacionados.