34 votos

Ejemplos reales de distribuciones comunes

Soy un estudiante de posgrado, el desarrollo de un interés para las estadísticas. Me gusta el material sobre todas las cosas, pero a veces me resulta difícil pensar acerca de las aplicaciones a la vida real. Específicamente, mi pregunta es sobre la que comúnmente se utiliza distribuciones estadísticas (normal - beta - gamma, etc.). Supongo que para algunos casos puedo obtener las propiedades particulares que hacen que la distribución bastante agradable - memoryless propiedad de la exponencial, por ejemplo. Pero para muchos otros casos, no tengo una intuición acerca de la importancia y de las áreas de aplicación de las distribuciones comunes que vemos en los libros de texto.

Probablemente hay un montón de buenas fuentes de abordar mis preocupaciones, yo estaría encantado si usted podría compartir los. Yo sería mucho más motivados en el material si yo pudiera asociar con ejemplos de la vida real.

25voto

Eero Puntos 1612

Wikipedia tiene una página que enumera muchas de las distribuciones de probabilidad con enlaces para obtener más detalles acerca de cada distribución. Usted puede mirar a través de la lista y siga los enlaces para tener una mejor idea de los tipos de aplicaciones que las diferentes distribuciones que se utilizan comúnmente.

Sólo recuerde que estas distribuciones son usados para modelar la realidad y como Cuadro, dijo: "todos los modelos están equivocados, algunos modelos son útiles".

Aquí están algunas de las distribuciones comunes y algunas de las razones por las que son útiles:

Normal: Esto es útil para ver en los medios y otras combinaciones lineales (por ejemplo, los coeficientes de regresión) a causa de la CLT. Relacionado con esto es que si algo es conocido que surgen debido a los efectos aditivos de muchos tipos de pequeñas causas, a continuación, el normal puede ser una distribución razonable: por ejemplo, muchas de las medidas biológicas son el resultado de múltiples genes y múltiples factores ambientales y, por tanto, a menudo son aproximadamente normales.

Gamma: sesgada a la Derecha y útil para las cosas con un mínimo natural a 0. Utiliza comúnmente para el tiempo transcurrido y algunas variables financieras.

Exponencial: caso especial de la Gamma. Es memoryless y escalas fácilmente.

Chi-cuadrado ($\chi^2$): caso especial de la Gamma. Surge como la suma de los cuadrados de las variables normales (tan utilizado para las varianzas).

Beta: Definida entre 0 y 1 (pero podría ser transformado para ser entre otros valores), útil para proporciones o de otras cantidades que debe estar entre 0 y 1.

Binomio: Cómo muchos de los "éxitos" de un determinado número de ensayos independientes con la misma probabilidad de "éxito".

Poisson: Común para la cuenta. Bonito propiedades que si el número de eventos en un período de tiempo o área sigue una distribución de Poisson, entonces el número en el doble del tiempo o de la zona que todavía sigue la distribución de Poisson (con el doble de la media): esto funciona para la adición de Poissons o escala con valores, con excepción de 2.

Tenga en cuenta que si se producen eventos a lo largo del tiempo y el tiempo entre ocurrencias de la siguiente manera exponencial, a continuación, el número que se producen en un período de tiempo sigue una distribución de Poisson.

Binomial negativa: Cuenta con un mínimo de 0 (u otro valor dependiendo de la versión) y no hay límite superior. Conceptualmente es el número de "fracasos" antes de k "éxitos". La binomial negativa es también una mezcla de Poisson variables cuyos recursos provienen de una distribución gamma.

Geométrica: caso especial para la binomial negativa, donde es el número de "fracasos" antes del 1 de "éxito". Si trunca (redondeo hacia abajo) un aumento exponencial de la variable para hacer que sea discreto, el resultado es geométrica.

4voto

Mark L. Stone Puntos 2037

Comprar y leer al menos los primeros 6 capítulos (primera 218 páginas) de William J. Feller "Una Introducción a la Teoría de la Probabilidad y Sus Aplicaciones, Vol. 2" http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb . Al menos leer todos los Problemas para la Solución, y preferiblemente tratar problemas como muchos como usted puede. No es necesario haber leído Vol 1, que en mi opinión no es especialmente meritorio.

A pesar de que el autor de haber fallecido 45 1/2 años atrás, antes de que el libro fue terminado aún, este es simplemente el mejor libro es, sin duda, para el desarrollo de la intuición en la probabilidad y los procesos estocásticos, y la comprensión y el desarrollo de una idea para varias distribuciones, cómo se relacionan con fenómenos del mundo real, y diversos fenómenos estocásticos que pueden ocurrir y ocurren. Y con la sólida base que se va a construir a partir de él, usted será bien servido en las estadísticas.

Si usted puede hacer esto a pesar de que en los capítulos siguientes, que se vuelve un poco más difícil, se estará a años luz por delante de casi todo el mundo. Simplemente, si usted sabe Feller Vol 2, usted sabe que la probabilidad (y procesos estocásticos); lo que significa que, cualquier cosa que usted no sabe, como los nuevos desarrollos, usted será capaz de recoger rápidamente y master por el edificio en que se base sólida.

Casi todo lo anteriormente mencionado en este hilo es en Feller Vol 2 (no todo el material en Kendall Avanzados de la Teoría de las Estadísticas, pero la lectura de ese libro va a ser un pedazo de la torta después de Feller Vol 2), y más, mucho más, todo de una manera en la que debe desarrollar su estocástico pensamiento y la intuición. Johnson y Kotz es bueno para minucias en varias distribuciones de probabilidad, Feller Vol 2 es útil para aprender a pensar probabilísticamente, y sabiendo lo que se va a extraer de Johnson y Kotz y cómo usarlo.

3voto

mat_geek Puntos 1367

Teoría asintótica conduce a la distribución normal, el valor extremo tipos, estable de las leyes y de la distribución de Poisson. La exponencial y Weibull tienden a subir como paramétrico de tiempo para distribución de eventos. En el caso de la de Weibull es un valor extremo tipo para el mínimo de una muestra. Relacionados con los modelos paramétricos para una distribución normal, las observaciones de la chi cuadrado, t y F de las distribuciones de surgir en la prueba de hipótesis y el intervalo de confianza de la estimación.El chi cuadrado también vienen en tablas de contingencia y análisis de la bondad de ajuste de las pruebas. Para el estudio de la potencia de las pruebas tenemos la noncentral t y F de las distribuciones. La distribución hipergeométrica surge en la prueba exacta de Fisher para tablas de contingencia. La distribución binomial es importante cuando se realizan experimentos para estimar las proporciones. La binomial negativa es una importante distribución para el modelo de sobredispersión en un punto del proceso. Eso te dará un buen comienzo en la práctica paramétrico distrbutions. Para no negativo de las variables aleatorias en (0, ∞) la distribución Gamma es flexible para proporcionar una variedad de formas y el registro de lo normal también es comúnmente utilizado. En [0,1] la beta de la familia proporciona simétrica distirbutions incluyendo el uniforme así como las distribuciones sesgadas a la izquierda o sesgada a la derecha.

También debo mencionar que si quieres saber todos los detalles nitty gritty acerca de las distribuciones en las estadísticas no son el clásico de la serie de libros de Johnson y Kotz que incluyen distribuciones discretas, continuas distribuciones univariantes y continua multivariante de las distribuciones y también el volumen 1 de la Avanzada de la Teoría de la Estadística de Kendall y Stuart.

2voto

kjetil b halvorsen Puntos 7012

Sólo para agregar a los otros excelentes respuestas.

La distribución de Poisson es útil cuando tenemos variables de conteo, como otros han mencionado. Pero mucho más debe ser dicho! La distribución de poisson surge asintóticamente a partir de una variable de distribución Binomial, cuando $n$ (el número de experimentos de Bernoulli) aumenta sin límites, y $p$ (la probabilidad de éxito de cada experimento() va a cero, en un wat que $\lambda=n p$ permanece constante, apartó a partir de cero y el infinito. Esto nos dice que es útil cuando tenemos un gran número de forma individual eventos muy improbables. Algunos buenos ejemplos son: accidentes , tales como el número de accidentes automovilísticos en Nueva York en un día, ya que cada vez que dos coches pasa/cumple hay una muy baja probabilidad de un accidente, y el número de oportunidades es, de hecho astronómico! Ahora usted puede pensar en otros ejemplos, tales como el número total de accidentes aéreos en el mundo en un año. El ejemplo clásico donde el número de muertes por horsekicks en el Preussian de caballería!

Cuando la distribución de Poisson se utiliza en epidemiología, para modelar el número de casos de alguna enfermedad, uno encuentra a menudo no se ajusta bien: La varianza es muy grande! La distribución de Poisson tiene varianza=media, que se puede ver fácilmente desde el límite de la binomial: En el binomio de la varianza es $n p (1-p)$, y al $p$ va a cero, necesariamente, $1-p$ va a uno, por lo que la varianza va a $np$, que es la expectativa, y los dos fueron a $\lambda$. Es una forma de búsqueda de una alternativa a la distribución de Poisson con mayor varianza, no condicionado a la igualdad de la media, como la binomial negativa. ¿Pero, por qué este fenómeno de mayor varianza, se producen? Una posibilidad es que el individuo probabilidades de enfermedad $p$ para una persona, no son constantes, y tampoco depende de algunos observó covariable (decir la edad, la ocupación, condición de fumador, ...) Que se denomina heterogeneidad no observada, y a veces los modelos utilizados para es se llama la fragilidad de los modelos, o modelos mixtos. Una forma de hacer esto es suponiendo que la $p$'s en la población proviene de algunos de distribución, y suponiendo que es una distribución gamma, por ejemplo (lo que hace que para el más simple de matemáticas...), obtenemos el valor de gamma-distribución de poisson --- que recupera la binomial negativa!

1voto

JW. Puntos 386

Recientemente publicó una investigación sugiere que el rendimiento humano NO está normalmente distribuida, al contrario de lo que pensaba. Los datos de los cuatro campos analizados fueron: (1) los Académicos en 50 disciplinas, basado en la frecuencia de publicación en el más preeminente de la disciplina específica de revistas. (2) Artistas, actores, músicos y escritores, y el número de prestigiosos premios, nominaciones o distinciones recibidas. (3) los Políticos en 10 de las naciones y de la elección/reelección de los resultados. (4) Colegial y profesional de los atletas que buscan en la mayoría de los individualizado de las medidas disponibles, tales como el número de home runs, recepciones en los deportes de equipo y el total de triunfos en los deportes individuales. El autor escribe, "vimos una clara y consistente de ley de potencia de distribución se desarrollan en cada estudio, independientemente de cómo de manera amplia o reducida se analizaron los datos..."

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X