¿Qué distribución tienen mis datos?

Question

¿Qué distribución tienen mis datos?

Preguntado el 14 de Septiembre, 2016: Cuando se hizo la pregunta
319 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Tengo datos del total de entradas vendidas de un solo cine a nivel diario. Son datos diarios de 2 años para cada fecha de exhibición. Hice la prueba de Anderson-Darling utilizando ad.test() en el paquete nortest en R y los resultados fueron significativos, lo que significa que no es una distribución normal según este tutorial . ¿Es un binomio por casualidad? ¿O qué es?

Esto es QQplot

Este es el gráfico de densidad

Este es un simple gráfico de datos utilizando la función qplot del paquete ggplot en R

¿Puede alguien sugerir qué distribución tiene esta variable? A simple vista, el segundo y tercer gráfico parecen una distribución sesgada a la derecha. Quiero usar esto para la regresión y quiero estar seguro de la distribución para poder seguir adelante.

Editar: Encontré un paquete R fitdistrplus y utilicé fitdist() para probar diferentes distribuciones. A continuación se muestra cómo qqplot parece en cada distribución y por debajo de los valores aic

library(fitdistrplus)
#gamma distribution
fit.fg <- fitdist(data$Tot_ticket_sold, "gamma")
#log normal
fit.fln <- fitdist(data$Tot_ticket_sold, "lnorm")
#weibull
fit.fw <- fitdist(data$Tot_ticket_sold, "weibull")
#normal
fit.fn <- fitdist(data$Tot_ticket_sold, "norm")

compruebe el qqplot y la densidad emperática y teórica para ver qué se ajusta mejor

plot(fit.fg)
plot(fit.fln)
plot(fit.fw)
plot(fit.fn)

encontrar el aic más bajo

> fit.fg$aic
[1] 656590.6
> fit.fln$aic
[1] 664127.3
> fit.fw$aic
[1] 656753.2
> fit.fn$aic
[1] 691545.8

Parece una distribución gamma.

Preguntado el 14 de Septiembre, 2016 por JCalcines

Answer 1

1 Respuestas

Answer 2

5voto

Antoni Parellada Puntos 2762

Compruebe el distribución logarítmica normal . Tengo algunas notas al respecto aquí .

Son datos de recuento, por lo que no bajan de cero, y tienen un sesgo positivo porque de vez en cuando una película taquillera atrae a multitudes al cine. Normalmente Sin embargo, (juego de palabras), tiene una forma de campana. Esto parece estar en consonancia con la multiplicativo proceso que puede explicar los recuentos de bacterias o células ( Problemas con el uso de la distribución normal - y formas de mejorar la calidad y la eficiencia del análisis de datos Eckhard Limpert, Werner A. Stahel en PLoS ONE, julio de 2011, vol.6, número 7. ). Me pregunto si sus entradas pueden ser comparadas con patos ...

¿Puede usted tomar los registros y ejecutar su parcela QQ de nuevo ?

Respondido el 14 de Septiembre, 2016 por Antoni Parellada (2762 Puntos )

¿Qué distribución tienen mis datos?

compruebe el qqplot y la densidad emperática y teórica para ver qué se ajusta mejor

encontrar el aic más bajo

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Qué distribución tienen mis datos?

compruebe el qqplot y la densidad emperática y teórica para ver qué se ajusta mejor

encontrar el aic más bajo

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: