6 votos

¿Qué distribución esto altamente alcanzó su punto máximo y había sesgado de la trama de la densidad?

La densidad de mi conjunto de datos se traza en R como sigue.

enter image description here

¿Qué tipo de distribución cabrían estos datos?

Como no tengo experiencia para contar por visualización, sólo puedo adivinarlo que no se distribuye normalmente. Pruebo con R: algunas orientaciones como punto de partida es altamente deseable.

4voto

Bryan Rehbein Puntos 3947

Se ve más bien como una distribución exponencial (suponiendo que el bit 0 es un artefacto de suavizado en la estimación de densidad).

Me gustaría ver a un qqplot. En R, si x contiene sus datos:

n <- length(x)
qqplot(x, qexp( (1:n - 0.5)/n ) )

Tenga en cuenta que en el uso de density() para el no-negativos, lo mejor es usar from=0 ya que usted sabe que la densidad es 0 por debajo de 0.

plot(density(x, from=0))

Creo también que, si $X$ sigue una distribución exponencial, a continuación, $e^{-X/\mu_X}$ debe seguir una distribución uniforme, por lo que el siguiente podría ser un razonables de diagnóstico:

hist(exp(-x/mean(x)), breaks=2*sqrt(length(x)))

3voto

jldugger Puntos 7490

Usualmente no es posible identificar una distribución de mirar un histograma como este.

Como un inicio, la trama de la densidad en una escala logarítmica:

Log density plot

La cola de esta densidad (de alrededor de 40 en adelante) es casi lineal, lo que indica que está cerca de la exponencial. Eso es parte de la caracterización. Para ir más allá de comparar la densidad de esta caracterización mediante la formación de los residuos (en una escala logarítmica, de manera efectiva, tomando la relación de la densidad a una curva exponencial):

Residuals

Claramente esta densidad es no exponencial: para valores pequeños es casi cuatro veces mayor que el ajuste exponencial a la cola indican. Debemos ir más allá de la caracterización.

Buscamos caracterizar los residuos de la forma más simple posible: esto significa en términos de largas segmentos rectos o parabólico secciones. (En esta escala logarítmica, un segmento recto es una tendencia exponencial, mientras que una sección parabólica parece un pedazo de una Normal de distribución.) Evidentemente hay dos parabólico como secciones: un afilado pico uno centrado cerca de 1 y un poco profunda, amplia centrada cerca de 25-30. La primera correspondería a una parte sana de una truncada distribución Normal con una pequeña desviación estándar (alrededor de 5-6), mientras que el segundo correspondería a la mayoría de los de una distribución Normal con una desviación estándar mayor (alrededor de 10). Esto indica que la densidad no va a ser adecuadamente descrito por una sencilla fórmula matemática, tales como los rayos Gamma o los de Weibull, pero tal vez se puede descomponer en una mezcla de dos o tres componentes. Look para cada uno de los componentes a tener algún sentido: en estos datos, de hecho, implican una combinación de fenómenos tienden a producirse cerca de 1, cerca de 25, y más allá de los 40?

1voto

Brettski Puntos 5485

Suponiendo que, como otros, que el pequeño bache por debajo de cero es un artefacto de una densidad proceso de alisado, más que a una pequeña cantidad de datos negativos, su distribución se ve como una distribución exponencial.

Me gustaría empezar con una distribución exponencial, o un poco más flexible de distribución de Weibull, y ver si alguno de estos parece encajar bien. Los dos son una decente equilibrio entre la dificultad de implementar, visualizar, etc. y tener una posibilidad decente de ajustar sus datos.

1voto

Scotticket Puntos 6

Se trata de una distribución de cola larga. GB2 (beta generalizada de segunda clase) con cuatro parámetros tiene una buena flexibilidad para este tipo de datos. Es en el paquete GB2 .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X