¿Qué significa "la frecuencia acumulada en forma de probits" (ver diagrama)? ¿Cómo se utiliza esta metodología cuando solo se tiene la información de la Razón y el grupo? Me pregunto cómo calcular estos probits para las frecuencias acumuladas (preferiblemente en R). Gracias de antemano por tu ayuda y tiempo.
Respuesta
¿Demasiados anuncios?Este es un gráfico de probabilidad lognormal etiquetado con porcentajes en lugar de cuantiles lognormales.
Específicamente, deja que los datos ordenados estén escritos $x_1 \le x_2 \le \cdots \le x_n$ y deja que $\Phi$ sea la función de distribución acumulativa Normal estándar. Forma una secuencia paralela de puntos de gráfica correspondientes a porcentajes de los datos; una regla conveniente y simple es asociar $p_i = \frac{i-1/2}{n}$ con $x_i$. Haz un gráfico de dispersión de estos datos a través de los pares ordenados
$$\left(\log(x_i), \Phi^{-1}(p_i)\right)$$
Etiqueta el eje x con los valores de $x_i$ (no con sus logaritmos) y etiqueta el eje y con los valores de $p_i$ (no con sus cuantiles Normales).
En R
, qqnorm
casi logra todo esto, excepto que etiqueta el eje y con los cuantiles Normales. Puedes suministrar etiquetas personalizadas si lo deseas:
x <- exp(rnorm(500)) # Datos de muestra
qqnorm(x, datax=TRUE, log="x") # Gráfico de probabilidad con un eje de datos logarítmico
percentiles <- c(0.001, 0.025, 0.165, 0.500, 0.835, 0.975, 0.999)
mtext(as.character(percentiles), side=4, at=qnorm(percentiles), cex=0.8)