A veces es útil disponer de una guía visual cuando cuando se trata de juzgar si un gráfico de cuantiles normales está "lo suficientemente cerca a la linealidad.
En primer lugar, aquí hay una demostración de cómo R hace gráficos utilizando qqnorm
. Si los datos tienen nn puntos, entonces ppoints
hace un vector de nn puntos espaciados uniformemente entre 00 y 1.1. A continuación, para el eje horizontal, estos puntos se transforman por la función cuantílica normal estándar qnorm
. El eje vertical muestra el nn puntos de datos ordenados por el más pequeño al más grande.
En el programa siguiente, simulamos n=100n=100 puntos de Norm(μ=150,σ=9). En primer lugar, utilizamos qqnorm
para hacer un gráfico QQ normal de los datos con los círculos abiertos por defecto como puntos de trazado. A continuación utilizamos el método descrito anteriormente para poner puntos naranjas en los círculos abiertos de qqnorm
. Encajan perfectamente.
# method
set.seed(2020)
x = rnorm(100, 150, 9)
qqnorm(x)
points( qnorm(ppoints(100)), sort(x), pch=20,col="orange" )
![enter image description here]()
Ahora, haz un gráfico QQ normal de datos normales x
(panel izquierdo de abajo). Tal vez piense que el gráfico es demasiado "inestable" en las colas para para que la muestra sea normal
Volvemos a hacer el mismo QQ-plot en el panel de la derecha. Como orientación sobre la conformidad de estos puntos con una línea recta recta, utilizamos el método anterior y superponemos los QQ-plots (en azul claro) del método anterior para 20 muestras muestras normales con medias y desviaciones estándar coincidentes. Por último, para mayor claridad, refrescamos el gráfico de probabilidad original de el x
's.
par(mfrow = c(1,2))
set.seed(509)
x = rnorm(100, 150, 9)
qqnorm(x); qqline(x)
qqnorm(x)
for(i in 1:20) {
y = rnorm(100, mean(x), sd(x))
points( qnorm(ppoints(100)), sort(y),pch=20, col="skyblue")
}
points(qnorm(ppoints(100)), sort(x), pch=19) # refresh
par(mfrow=c(1,1))
![enter image description here]()
Parece que el gráfico QQ de los datos x
no es inusual para la normalidad muestras normales de tamaño n=100.
Algunos otros programas de software estadístico dan "bandas de confianza" en torno a de los gráficos de cuantiles. Parecen útiles, pero nunca he entendido exactamente a qué se refiere la probabilidad del 95%. Aquí hay un gráfico de una muestra normal de tamaño 100, realizado con una versión reciente de Minitab.
![enter image description here]()