6 votos

Determinar qué tan bien teniendo en cuenta datos reales se ajusta a una distribución de probabilidad dada

Digamos que tengo algunos datos, es decir, una colección de números reales.

¿Hay alguna buena métodos generales para determinar si estos datos se ajusta a una distribución de probabilidad dada, por ejemplo la distribución normal, la distribución log-normal o cualquier otra distribución? Si es así, ¿cuáles son algunos de los mejores métodos por ahí?

4voto

Sean Hanley Puntos 2428

Existen pruebas estadísticas que permiten comprobar si los datos son una forma inapropiada pobres partido a una distribución dada como @ChillPenguin ha señalado. Sin embargo, creo técnicas gráficas son los mejores para esta tarea.

Normalmente, el mejor enfoque es utilizar un qq-plot. Un poco menos, pero enfoque similar es el uso de un pp-parcela. Tenga en cuenta que un qq-plot le da una mejor resolución en las colas de la distribución, mientras que un pp-parcela le da una mejor resolución en el medio de la distribución. Como ya he dicho, la gente suele ir con un qq-plot, porque normalmente las desviaciones en las colas son más importantes.

Estos gráficos hacen que sea fácil ver que sus datos difieren de los de un teórico de la distribución, pero a veces es difícil de interpretar cómo se están desviando. Si usted ha activado un qq-plot, y están preocupados de que sus datos no encajan, pero desea una imagen más clara de la forma en que se manifiesta, un método es hacer un kernel demsity de la trama de datos, posiblemente cubrió con un teórico de la distribución que tiene la misma media y SD.

Tenga en cuenta que ninguno de estos enfoques necesariamente indica que la distribución de los datos provienen de ellos solo decirte que el ajuste es razonable o pobres. Si son pobres, entonces usted necesita para utilizar su conocimiento de los datos y de la gama de distribuciones que existen para escoger otro contendiente para explorar. Por ejemplo, si usted tenía una distribución de cargos, por ejemplo, el número de accidentes automovilísticos en diferentes lugares, y comprobé con una normal, lo más probable es que encontrar a un mal ajuste. Sin embargo, no hay nada allí le dirá que usted debe comprobar sus datos en contra de una distribución de Poisson lugar; usted necesita saber acerca de ti mismo.

2voto

Chill Penguin Puntos 11

Dado un modelo (es decir, un paramétrica de la familia de distribuciones, la familia de distribuciones normales parametrizadas por la media y la varianza), la más sencilla de hacerlo es utilizar la estimación de máxima verosimilitud para estimar los parámetros, a continuación, utilizar la función de densidad de probabilidad para evaluar cómo típico son los datos. Si el modelo es convencional y parsimonioso (en lugar de ser adaptados a los datos, o algo), y hace que los datos mirada razonablemente típica, se puede argumentar que el modelo es lo suficientemente bueno.

De bondad de ajuste de los exámenes a menudo se recomienda para este tipo de cosas, pero lo único que sirves es para justificar una declaración de que los datos no provienen de una distribución dada. Error de rechazar la hipótesis nula de una bondad de ajuste prueba no es evidencia de que los datos no provienen de la distribución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X