14 votos

Necesito ayuda para identificar una distribución por su histograma

Tengo la población de muestra de los máximos de amplitud registrados de una determinada señal. La población es de unos 15 millones de muestras. Produje un histograma de la población, pero no puedo adivinar la distribución con tal histograma.

EDIT1: El archivo con los valores brutos de la muestra está aquí: datos en bruto

¿Puede alguien ayudar a estimar la distribución con el siguiente histograma: enter image description here

23voto

Alp Puntos 446

Utilice fitdistrplus:

Aquí está el Enlace CRAN a fitdistrplus.

Aquí está el enlace a la antigua viñeta para fitdistrplus.

Si el enlace de la viñeta no funciona, busque "Use of the library fitdistrplus to specify a distribution from data".

La viñeta explica muy bien cómo utilizar el paquete. Se puede ver cómo encajan varias distribuciones en un corto período de tiempo. También produce un Diagrama Cullen/Frey.

#Example from the vignette
library(fitdistrplus)
x1 <- c(6.4, 13.3, 4.1, 1.3, 14.1, 10.6, 9.9, 9.6, 15.3, 22.1, 13.4, 13.2, 8.4, 6.3, 8.9, 5.2, 10.9, 14.4)
plotdist(x1)
descdist(x1)

f1g <- fitdist(x1, "gamma")
plot(f1g)
summary(f1g)      

enter image description here

enter image description here

7voto

AdamSane Puntos 1825

La población es de unos 15 millones de muestras.

Entonces es muy probable que pueda rechazar cualquier distribución particular de forma simple y cerrada.

Incluso esa pequeña protuberancia a la izquierda del gráfico puede ser suficiente para que digamos "claramente no es tal y tal".

Por otro lado, es probable que se aproxime bastante bien a una serie de distribuciones comunes; los candidatos obvios son cosas como la lognormal y la gamma, pero hay un montón de otras. Si miras el logaritmo de la variable x, probablemente puedas decidir si la lognormal está bien a la vista (después de tomar los logaritmos, el histograma debería parecer simétrico).

Si el logaritmo es asimétrico a la izquierda, considere si la Gamma está bien, si es asimétrico a la derecha, considere si la Gamma inversa o (aún más asimétrica) la Gaussiana inversa está bien. Pero este ejercicio consiste más bien en encontrar una distribución que se acerque lo suficiente como para vivir con ella; ninguna de estas sugerencias tiene realmente todas las características que parecen estar presentes allí.

Si tienes alguna teoría que apoye una elección, desechar toda esta discusión y usar eso.

1voto

Taylor Price Puntos 371

No estoy seguro de por qué querrías clasificar una muestra a una distribución específica con un tamaño de muestra tan grande; ¿parsimonia, comparándola con otra muestra, buscando la interpretación física de los parámetros?

La mayoría de los paquetes estadísticos (R, SAS, Minitab) permiten trazar los datos en un gráfico que produce una línea recta si los datos proceden de una determinada distribución. He visto gráficos que producen una línea recta si los datos son normales (logarítmicos normales, después de una transformación logarítmica), Weibull, y chi-cuadrado vienen a la mía inmediatamente. Esta técnica le permitirá ver los valores atípicos y le dará la posibilidad de asignar razones de por qué los puntos de datos son atípicos. En R, el gráfico de probabilidad normal se llama qqnorm.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X