9 votos

Definición formal de la línea qq utilizada en un diagrama de QQ

Me estoy haciendo un ajuste de la distribución de trabajo y estoy buscando Q-Q parcelas y cómo pueden ser utilizados visualmente para interpretar la bondad del ajuste.

Mis datos es pesado de cola, así que estoy mirando de Weibull, log-normal, Pareto y log-logística distribuciones inicialmente.

Para una distribución de Weibull, entiendo cómo los puntos en el Q-Q plot se construyen (el uso de los cuantiles de los datos observados frente a los cuantiles de un estimado de la distribución de Weibull). La pieza no tengo claro es cómo la línea de Q-Q parcelas se calcula/construido.

El R de la documentación para la qqplot() función proporciona la siguiente descripción:

qqnorm es una función genérica el método predeterminado de los cuales produce una normal Q la trama de los valores de y. qqline añade una línea a un "teórico", por defecto normal, cuantil-cuantil de la parcela que pasa a través de la probs cuantiles, por defecto, el primer y tercer cuartiles.

Otro post sobre la Cruz Validado parece indicar que la línea es esencialmente una línea construida a partir de los parámetros de la teórica (estimado) de distribución. Esta es una declaración verdadera y correcta interpretación?

Si un enlace a una definición formal podría ser proporcionada me gustaría mucho aprecio.

10voto

Ben Bolker Puntos 8729

Especie de "ambos" - la línea depende de la observó de cuantiles (que definen el eje de la QQ plot) y la espera/teórico/referencia de cuantiles (que definir el eje de las x). La documentación (que se cita) siempre debe ser tomado como la canónica de referencia:

'qqline' añade un la línea de un "teórico", por defecto normal, cuantil-cuantil de la parcela que pasa a través de los 'problemas' de cuantiles, por defecto la primera y el tercer cuartiles.

En caso de duda, USTL ("el Uso de la Fuente, Lucas") , el cual puede ser encontrado aquí: aquí un poco resumida y comentada versión

 ## quantiles (.25 and 0.75 by default) of data
 y <- quantile(y, probs, names=FALSE, type=qtype, na.rm = TRUE)
 ## quantiles of reference/theoretical distribution
 x <- distribution(probs)
 ## ...
 slope <- diff(y)/diff(x)  ## observed slope between quantiles
 int <- y[1L]-slope*x[1L]  ## intercept
 abline(int, slope, ...)   ## draw the line

Para lo que vale, creo que este enfoque (de la línea de conexión central de cuantiles) se utiliza debido a que cumple con los siguientes criterios para la exploración de petróleo/enfoques de diagnóstico:

  • rápida (por ejemplo, no hay necesidad de ejecutar una regresión lineal, acaba de encontrar la cuantiles y dibujar una línea recta)
  • robusto (que sólo depende de la conducta de la parte central de la distribución, no será expulsado por extraño colas)

4voto

Mo Friedrich Puntos 115

Creo que simplemente agrega un segmento de línea entre los puntos (x1, y1) y (x2, y2) para las probabilidades dadas (p1, p2)

(x1, x2) son los cuantiles de la distribución teórica; (y1, y2) para la comparación de datos. La función qline tiene un código simple debajo del capó. Esto es simple, por ejemplo, en R

 # sample data
set.seed(2)
y <- rt(100, df = 5)

# get the values
probs <- c(0.25, 0.75)
x1 <- qnorm(probs[1])
x2 <- qnorm(probs[2])
y1 <- quantile(y, probs[1])
y2 <- quantile(y, probs[2])

# plot
qqnorm(y)
segments(x1, y1, x2, y2, col = "red", lwd = 2)
qqline(y, lty = 2)
# theoretical match is straight line. If you add more samples, qqline should 
# converge to this
abline(0,1)
 

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X