1 votos

Diferentes resultados para la distribución normal residual entre la prueba de Jarque-Bera y el Q-Q Plot

Estoy tratando de probar la normalidad de los residuos utilizando 2 formas diferentes:

  1. Utilizando la prueba de Jarque-Bera
  2. Diagrama Q-Q

Puedo ver resultados diferentes, para la prueba JB el valor es 19,9553 con una probabilidad de 0,00005. Por lo tanto, no podemos rechazar las hipótesis nulas, y esto concluye que hay una distribución no normal de los resultados.

Por otra parte, cuando tracé el mismo conjunto de datos utilizando el gráfico Q-Q, pude ver una relación parcialmente lineal, que podría apuntar a una distribución normal. Dado que el tamaño de las observaciones es de 62 y el modelo de regresión que se utilizó es el modelo OLS.

enter image description here

¿Crees que he hecho algo mal en mi suposición?

2 votos

OLS es una técnica de estimación, no un modelo. Su modelo es probablemente un modelo lineal.

1 votos

A menudo es difícil evaluar la normalidad utilizando las pruebas estándar de normalidad. Para las pequeñas $n$ Estas pruebas no tienen la potencia necesaria para distinguir la normalidad de la uniformidad o la exponencialidad. Para los grandes $n$ Las peculiaridades de poca importancia práctica pueden hacer que se rechacen muestras casi normales. En la práctica, muchos estadísticos prefieren juzgar la distribución normal mediante gráficos Q-Q.

0voto

manku Puntos 111

Aquí hay seis muestras, de tamaños $10,10,10,1000,1000,1000$ y de las distribuciones estándar (uniforme, exponencial, normal exponencial, normal), respectivamente.

Se muestra un gráfico Q-Q normal para cada muestra, con el valor P de Shapiro-Wilk en la esquina superior izquierda de cada una.

Es difícil juzgar la normalidad con sólo diez observaciones. Los gráficos Q-Q son generalmente útiles para muestras de mil. Y, con 1.000 observaciones, la prueba S-W a menudo da resultados útiles. (La prueba de normalidad S-W se utiliza ampliamente y muchos estadísticos la consideran una de las mejores, pero no pretendo que sea la mejor para sus fines).

enter image description here

A continuación se muestra el código R para tres paneles de la figura. (Se sacrificó la elegancia sacrificado por la simplicidad).

par(mfrow=c(2,3))
set.seed(2021)

x = runif(10)
pv=shapiro.test(x)$p.val; pv
[1] 0.8485772
qqnorm(x, main="10 Unif"); qqline(x, col="blue")
 text(-1.1, .9, round(pv,5))

...

z = rnorm(10)
pv = shapiro.test(z)$p.val; pv
[1] 0.08000124
qqnorm(x, main="10 Norm"); qqline(x, col="blue")
 text(-1.1, .9, round(pv,5))

u = runif(1000)
pv = shapiro.test(u)$p.val; pv
[1] 2.473175e-17;  if(pv < .0001) pv = 0
qqnorm(u, main="1000 Unif"); qqline(x, col="blue")
 text(-3, .82, round(pv,5))

 ...

par(mfrow=c(1,1))

Nota: Existen varios debates exhaustivos sobre los mejores métodos para juzgar la normalidad en este sitio. Puede empezar por mirar algunas de las páginas enlazadas en el margen como 'Relevante', y luego probar con la función de búsqueda en la parte superior de la página. Y algunos de mis colegas pueden publicar comentarios con sus enlaces favoritos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X