Aquí hay seis muestras, de tamaños $10,10,10,1000,1000,1000$ y de las distribuciones estándar (uniforme, exponencial, normal exponencial, normal), respectivamente.
Se muestra un gráfico Q-Q normal para cada muestra, con el valor P de Shapiro-Wilk en la esquina superior izquierda de cada una.
Es difícil juzgar la normalidad con sólo diez observaciones. Los gráficos Q-Q son generalmente útiles para muestras de mil. Y, con 1.000 observaciones, la prueba S-W a menudo da resultados útiles. (La prueba de normalidad S-W se utiliza ampliamente y muchos estadísticos la consideran una de las mejores, pero no pretendo que sea la mejor para sus fines).
A continuación se muestra el código R para tres paneles de la figura. (Se sacrificó la elegancia sacrificado por la simplicidad).
par(mfrow=c(2,3))
set.seed(2021)
x = runif(10)
pv=shapiro.test(x)$p.val; pv
[1] 0.8485772
qqnorm(x, main="10 Unif"); qqline(x, col="blue")
text(-1.1, .9, round(pv,5))
...
z = rnorm(10)
pv = shapiro.test(z)$p.val; pv
[1] 0.08000124
qqnorm(x, main="10 Norm"); qqline(x, col="blue")
text(-1.1, .9, round(pv,5))
u = runif(1000)
pv = shapiro.test(u)$p.val; pv
[1] 2.473175e-17; if(pv < .0001) pv = 0
qqnorm(u, main="1000 Unif"); qqline(x, col="blue")
text(-3, .82, round(pv,5))
...
par(mfrow=c(1,1))
Nota: Existen varios debates exhaustivos sobre los mejores métodos para juzgar la normalidad en este sitio. Puede empezar por mirar algunas de las páginas enlazadas en el margen como 'Relevante', y luego probar con la función de búsqueda en la parte superior de la página. Y algunos de mis colegas pueden publicar comentarios con sus enlaces favoritos.
2 votos
OLS es una técnica de estimación, no un modelo. Su modelo es probablemente un modelo lineal.
1 votos
A menudo es difícil evaluar la normalidad utilizando las pruebas estándar de normalidad. Para las pequeñas $n$ Estas pruebas no tienen la potencia necesaria para distinguir la normalidad de la uniformidad o la exponencialidad. Para los grandes $n$ Las peculiaridades de poca importancia práctica pueden hacer que se rechacen muestras casi normales. En la práctica, muchos estadísticos prefieren juzgar la distribución normal mediante gráficos Q-Q.