55 votos

Parcelas PP frente a parcelas QQ

¿Cuál es la diferencia entre los gráficos de probabilidad, los gráficos PP y los gráficos QQ cuando se trata de analizar una distribución ajustada a los datos?

5 votos

Parece que wikipedia puede ayudarte con esto: diagrama de probabilidad . Parcela QQ , Parcela PP . Si tiene una pregunta más concreta, aclárela.

56voto

Sean Hanley Puntos 2428

Como @vector07 notas , diagrama de probabilidad es la categoría más abstracta de la que forman parte pp-plots y qq-plots. Por lo tanto, hablaré de la distinción entre estas dos últimas. La mejor manera de entender las diferencias es pensar en cómo se construyen, y entender que es necesario reconocer la diferencia entre los cuantiles de una distribución y la proporción de la distribución por la que se ha pasado cuando se alcanza un cuantil dado. Se puede ver la relación entre ambos representando gráficamente los función de distribución acumulativa (FCD) de una distribución. Por ejemplo, consideremos la distribución normal estándar:

enter image description here

Vemos que aproximadamente el 68% del eje y (región entre líneas rojas) corresponde a 1/3 del eje x (región entre líneas azules). Eso significa que cuando utilizamos la proporción de la distribución por la que hemos pasado para evaluar la correspondencia entre dos distribuciones (es decir, utilizamos un pp-plot), obtendremos mucha resolución en el centro de las distribuciones, pero menos en las colas. Por otro lado, cuando utilizamos los cuantiles para evaluar la coincidencia entre dos distribuciones (es decir, utilizamos un gráfico qq), obtendremos una resolución muy buena en las colas, pero menor en el centro. (Como los analistas de datos suelen preocuparse más por las colas de una distribución, que tendrán más efecto en la inferencia, por ejemplo, los qq-plots son mucho más comunes que los pp-plots).

Para ver estos hechos en acción, recorreré la construcción de un pp-plot y un qq-plot. (También repaso la construcción de un qq-plot verbalmente / más lentamente aquí: El gráfico QQ no coincide con el histograma .) No sé si usas R, pero espero que sea autoexplicativo:

set.seed(1)                           # this makes the example exactly reproducible
N = 10                                # I will generate 10 data points
x = sort(rnorm(n=N, mean=0, sd=1))    #  from a normal distribution w/ mean 0 & SD 1
n.props = pnorm(x, mean(x), sd(x))    # here I calculate the probabilities associated
                                      #  w/ these data if they came from a normal 
                                      #  distribution w/ the same mean & SD

   # I calculate the proportion of x we've gone through at each point
props = 1:N / (N+1)
n.quantiles = qnorm(props, mean=mean(x), sd=sd(x))  # this calculates the quantiles (ie
                                                    #  z-scores) associated w/ the props
my.data = data.frame(x=x, props=props,              # here I bundle them together
                     normal.proportions=n.props, 
                     normal.quantiles=n.quantiles)
round(my.data, digits=3)                            # & display them w/ 3 decimal places
#         x        props  normal.proportions  normal.quantiles
# 1  -0.836        0.091               0.108            -0.910
# 2  -0.820        0.182               0.111            -0.577
# 3  -0.626        0.273               0.166            -0.340
# 4  -0.305        0.364               0.288            -0.140
# 5   0.184        0.455               0.526             0.043
# 6   0.330        0.545               0.600             0.221
# 7   0.487        0.636               0.675             0.404
# 8   0.576        0.727               0.715             0.604
# 9   0.738        0.818               0.781             0.841
# 10  1.595        0.909               0.970             1.174

enter image description here

Desgraciadamente, estos gráficos no son muy distintivos, porque hay pocos datos y estamos comparando una normal verdadera con la distribución teórica correcta, así que no hay nada especial que ver ni en el centro ni en las colas de la distribución. Para demostrar mejor estas diferencias, a continuación muestro una distribución t (de colas gruesas) con 4 grados de libertad y una distribución bimodal. Las colas gruesas son mucho más distintivas en el gráfico qq, mientras que la bimodalidad es más distintiva en el gráfico pp.

enter image description here enter image description here

12voto

Nick Sergeant Puntos 3792

He aquí una definición de v8doc.sas.com :

Un gráfico P-P compara la función de distribución acumulativa empírica de un conjunto de datos con una función de distribución acumulativa teórica especificada F(-). Un gráfico Q-Q compara los cuantiles de una distribución de datos con los cuantiles de una distribución teórica normalizada de una familia especificada de distribuciones.

En el texto también se menciona:

  • diferencias en cuanto a la forma de construir e interpretar los gráficos P-P y Q-Q.
  • ventajas de utilizar una u otra, en lo que respecta a la comparación de distribuciones empíricas y teóricas.

Referencia :

SAS Institute Inc., SAS OnlineDoc®, Versión 8, Cary, NC: SAS Institute Inc., 1999.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X