15 votos

¿Hay un análogo continuo de la distribución hipergeométrica?

¿Como dice el título, hay un análogo continuo de una distribución hipergeométrica?

Si $ X \sim H(m,n,N)$ es una distribución hipergeométrica común, donde $N$ es el tamaño de la población, $n$ es el número de sorteos, y $m$ es el número de éxito. En mi caso $N,n,m$ no son enteros, por lo tanto podría tener no un número entero de éxito.

16voto

Halfgaar Puntos 2866

Versión corta, sí.

Versión larga, es complicado. Hay un interesante vínculo entre las distribuciones de probabilidad y polinomios ortogonales. Por ejemplo, consideremos los polinomios de Hermite, $H_0, H_1, \ldots$. Estos son ortogonales con respecto a la función peso $e^{-x^2/2}$ sobre el apoyo a la $(-\infty,\infty)$. En otras palabras, $\int_{-\infty}^{\infty}H_i(x)H_j(x)e^{-x^2/2}dx = \sqrt{2\pi}i!\delta_{ij}$.

La función de ponderación y el coeficiente de tener un factor de $\sqrt{2\pi}$ debe sonar una campana; específicamente, se encuentran estos representado en una distribución normal estándar.

Norbert Wiener reconoció que los dos están estrechamente vinculados y se desarrolló lo que se llama el de Gauss-Hermite Polinomio Caos. En resumen, podemos escribir una variable aleatoria $k$ de cualquier distribución, como una serie infinita acerca de una variable aleatoria $\zeta$ normal (Gaussiana) de distribución mediante los polinomios de Hermite como funciones de base: $$ k = \sum_{i=0}^{\infty}k_i H_i(\zeta).$$

Resulta, se puede generalizar esto para otras distribuciones, y a distribuciones discretas.

Hay algo que se llama la Askey Esquema, que es esencialmente un árbol de la familia relacionadas con hipergeométrica polinomios ortogonales. Muchas de las funciones de ponderación para estos polinomios son funciones de distribución para las distribuciones de probabilidad, lo que nos permite realizar una Wiener-Askey Polinomio Caos de expansión para cualquier variable aleatoria sobre otra variable aleatoria de casi cualquier distribución de nuestra elección. Vea también: http://www.dam.brown.edu/scicomp/media/report_files/BrownSC-2003-07.pdf

La hipergeométrica familia ligada a la discreta distribución hipergeométrica es el de Hahn familia de polinomios. La continua analógica es uncreatively llamado el "Continuo Hahn" de la familia. Esto nos lleva a la siguiente respuesta:

La función de ponderación de la Continua polinomios de Hahn le dará la continua analógica de la discreta distribución hipergeométrica. De hecho, lo más probable es idéntica a la de dentro de un parámetro de escala. Estas funciones son muy complicados, por lo que no es intuitivo.

El polinomio caos distribución es bastante interesante y potente. Si usted mira la expansión de la serie, es análogo a una expansión de Taylor de una variable aleatoria. Es importante destacar, que le permite escribir una variable aleatoria en un posiblemente desconocido o complicado de distribución en términos de distribución de su elección; como con cualquier expansión de la serie, el desafío es entonces calcular el determinista de los coeficientes. Esto se vuelve muy potente cuando usted tiene, por ejemplo, un sistema dinámico con parámetros acerca de un parámetro al azar, en lugar de utilizar complicadas modelos estocásticos, o desperdiciador de tiempo de Monte-Carlo, análisis, puede enmarcar el problema como uno de la informática, un puñado de determinista coeficientes, y generar momentos estadísticos y/o de Monte Carlo muestras de ellos fácilmente.

Curiosamente, el primer coeficiente, $k_0$ siempre representa la distribución de la media.

2voto

A.S.Stefanakis Puntos 41

Es también la prueba de Pearson de las distribuciones. En el artículo original el cambio de las probabilidades (en $k+1$ wrt $k$) de la distribución hipergeométrica dividido por la corriente de probabilidad es una función racional de los índice de $k$.

Pearson señaló que si la $k+1$ y k ir cerca, a continuación, en el límite este es un derivado de la pdf dividido por pdf y es igual a la función racional (1er fin de dividir un polinomio de segundo orden). Él resolvió el sistema y crea un producto Cartesiano (y gráfico) de cualquier entrada de parámetros. Me gustaría ver que sus distribuciones son simplemente la variable escalada veces normalizado Appell $F_1$ función. Yo diría que una generalización a la que sería una generalizada Lauricella $F^{(n)}_D$ función, normalizado, los tiempos de la variable escalada.

Me gusta mucho este simple pensamiento de Pearson. La razón por la que ha desarrollado esta función del sistema es que la vida real probabilidades de tener no un infinito rango de parámetros y no son simétricos igual que la Normal. Normal que no se ajustaban a los datos biológicos del día y que en este mundo nada es sin límites y la asimetría como la altura y el armslength de las personas y los cangrejos. Pero el artículo original (de la serie) es más interesante para leer. Debemos esta generalización a la antropología.

1voto

A.S.Stefanakis Puntos 41

Pearson ha publicado muchos artículos. Pruebe la última: http://rsta.royalsocietypublishing.org/content/216/538-548/429 Pero hay buenos motivos para verificar la previoys.

El Appel y Lauricella generalizaciones que no puede ser conocido de Pearson pero se mencionan!! y en el nombre de la ausencia de datos experimentales que se dejó (él dice que ellos son los que dejan en suspenso).

Usted puede trabajar hacia fuera cuando usted se dará cuenta de que para las raíces reales de la binomial en su ecuación, la integral de la función de distribución acumulativa se puede poner en la forma de una representación integral de estas funciones. Poner de lado a lado para decir.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X