6 votos

Interpreta los valores t cuando no se asume una distribución normal del término de error

Suponga que tiene una regresión con un conjunto completo de variables y sabe que los residuos no están distribuidos de forma normal. Entonces simplemente estima una regresión utilizando MCO para encontrar el mejor ajuste lineal. Para esto, renuncia a la suposición de errores distribuidos normalmente. Después de la estimación, tiene 2 coeficientes "significativos". Pero ¿cómo puede alguien interpretar estos coeficientes? Por lo tanto, no hay forma de decir: "Estos coeficientes son significativos", aunque la hipótesis $\beta=0$ puede ser rechazada con un alto estadístico t (debido a la renuncia a la suposición de errores normales). Pero ¿qué hacer en este caso? ¿Cómo argumentarías?

3voto

Eero Puntos 1612

Si los residuos no son normales (y hay que tener en cuenta que esto se aplica a los residuos teóricos en lugar de los residuos observados), pero no están demasiado sesgados o tienen valores atípicos, entonces se aplica el Teorema del Límite Central y la inferencia sobre las pendientes (pruebas t, intervalos de confianza) será aproximadamente correcta. La calidad de la aproximación depende del tamaño de la muestra y del grado y tipo de no normalidad en los residuos.

El TCL funciona bien para la inferencia sobre las pendientes, pero no se aplica a los intervalos de predicción para nuevos datos.

Si no estás satisfecho con el argumento del TCL (tamaños de muestra pequeños, sesgo, simplemente no estás seguro, quieres una segunda opinión, quieres convencer a un escéptico, etc.) entonces puedes usar métodos de bootstrap o permutación que no dependen de la suposición de normalidad.

1voto

Marc-Andre R. Puntos 789

Si los errores no siguen una distribución normal, se pueden utilizar resultados asintóticos. Supongamos que tu modelo es

$$y_i=x_i'\beta+\varepsilon_i$$

donde $(y_i,x_i',\varepsilon_i)$, $i=1,...,n$ es una muestra iid. Supongamos

\begin{align*} E(\varepsilon_i|x_i)&=0 \\ E(\varepsilon_i^2|x_i)&=\sigma^2 \end{align*}

y

$$rank(Ex_ix_i')=K,$$

donde $K$ es el número de coeficientes. Entonces, el estimador OLS usual $\hat\beta$ es asintóticamente normal:

$$\sqrt{n}(\hat\beta-\beta)\to N(0,\sigma^2E(x_ix_i'))$$

Las implicaciones prácticas de este resultado son que las estadísticas t usuales se convierten en estadísticas z, es decir, su distribución es normal en lugar de Student. Por lo tanto, puedes interpretar las estadísticas t como de costumbre, solo que los valores p deben ajustarse para la distribución normal.

Ten en cuenta que dado que este resultado es asintótico, no se cumple para tamaños de muestra pequeños. Además, las suposiciones utilizadas se pueden relajar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X