3 votos

¿Qué distribución tienen mis datos?

Tengo datos del total de entradas vendidas de un solo cine a nivel diario. Son datos diarios de 2 años para cada fecha de exhibición. Hice la prueba de Anderson-Darling utilizando ad.test() en el paquete nortest en R y los resultados fueron significativos, lo que significa que no es una distribución normal según este tutorial . ¿Es un binomio por casualidad? ¿O qué es?

Esto es QQplot enter image description here

Este es el gráfico de densidad enter image description here

Este es un simple gráfico de datos utilizando la función qplot del paquete ggplot en R enter image description here

¿Puede alguien sugerir qué distribución tiene esta variable? A simple vista, el segundo y tercer gráfico parecen una distribución sesgada a la derecha. Quiero usar esto para la regresión y quiero estar seguro de la distribución para poder seguir adelante.

Editar: Encontré un paquete R fitdistrplus y utilicé fitdist() para probar diferentes distribuciones. A continuación se muestra cómo qqplot parece en cada distribución y por debajo de los valores aic

enter image description here

library(fitdistrplus)
#gamma distribution
fit.fg <- fitdist(data$Tot_ticket_sold, "gamma")
#log normal
fit.fln <- fitdist(data$Tot_ticket_sold, "lnorm")
#weibull
fit.fw <- fitdist(data$Tot_ticket_sold, "weibull")
#normal
fit.fn <- fitdist(data$Tot_ticket_sold, "norm")

compruebe el qqplot y la densidad emperática y teórica para ver qué se ajusta mejor

plot(fit.fg)
plot(fit.fln)
plot(fit.fw)
plot(fit.fn)

encontrar el aic más bajo

> fit.fg$aic
[1] 656590.6
> fit.fln$aic
[1] 664127.3
> fit.fw$aic
[1] 656753.2
> fit.fn$aic
[1] 691545.8

Parece una distribución gamma.

5voto

Antoni Parellada Puntos 2762

Compruebe el distribución logarítmica normal . Tengo algunas notas al respecto aquí .

Son datos de recuento, por lo que no bajan de cero, y tienen un sesgo positivo porque de vez en cuando una película taquillera atrae a multitudes al cine. Normalmente Sin embargo, (juego de palabras), tiene una forma de campana. Esto parece estar en consonancia con la multiplicativo proceso que puede explicar los recuentos de bacterias o células ( Problemas con el uso de la distribución normal - y formas de mejorar la calidad y la eficiencia del análisis de datos Eckhard Limpert, Werner A. Stahel en PLoS ONE, julio de 2011, vol.6, número 7. ). Me pregunto si sus entradas pueden ser comparadas con patos ...

¿Puede usted tomar los registros y ejecutar su parcela QQ de nuevo ?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X