5 votos

Problema de la distribución hipergeométrica multivariante/Urn

Tengo una dificultad con el siguiente problema de distribución hipergeométrica multivariante. El escenario es el habitual, una urna contiene un total de $M$ bolas de $K$ colores únicos, con $N_1$ bolas de color 1, $N_2$ bolas de color 2, ..., $N_K$ bolas de color $K$ s.t. $N_1+N_2...+N_K = M$ . ¿Cuál es la probabilidad de que en una muestra de tamaño $n$ (sin reemplazo), la bola extraída en último lugar tiene un color no muestreado antes. Para simplificar, podemos suponer que $N_1=N_2=...=N_K=N$ es decir $M=KN$ .

He estado tratando de ver casos particulares con $K=2$ y $K=3$ (2 o 3 colores) con diferentes valores de tamaño de muestra, $n$ esperando poder generalizar las fórmulas para un número arbitrario de $K$ y $n$ . Así, por ejemplo, para $K=2$ y cualquier valor de $n$ Demostré que la probabilidad en cuestión podía hallarse mediante $K \cdot \frac{{N_1 \choose n-1}{N_2 \choose 1}}{n {M \choose n}}$ . Para $K=3$ podemos tener dos casos diferentes: a) sólo se muestrean 2 de los tres colores disponibles (con $n-1$ bolas del mismo color y 1 bola de un segundo color). La probabilidad deseada es entonces $K(K-1)\frac{{N_1 \choose 2}{N_2 \choose 0}{N_3 \choose 1}}{n {M \choose 3}}$ . Y el caso b) se muestrean los tres colores (1 bola de cada uno), entonces la probabilidad deseada es $K(K-1) \frac{{N_1 \choose 1}{N_2 \choose 1}{N_3 \choose 1}}{n{M \choose 3}}$ y la respuesta final es la suma de (a) y (b).

¿Le parece razonable esta lógica? Obviamente, al aumentar los valores de $k$ y $n$ el número de casos que hay que seguir también aumentará, pero parece que cada nuevo caso puede simplificarse en (o representarse por) un escenario previamente elaborado. En definitiva, parece que al final podré encontrar alguna relación recursiva pero después de un tedioso trabajo. Cualquier idea será muy apreciada. Más concretamente, ¿es éste un buen camino a seguir? Si es así, ¿hay algún atajo que pueda tomar? ¿Hay algún enfoque completamente diferente que pueda probar? Gracias, de antemano, Tamar

1voto

Oli Puntos 89

Se puede encontrar, para el caso general, una fórmula explícita para la probabilidad requerida. Mostramos, por ejemplo, cómo calcular la probabilidad de que la última bola extraída sea azul y no se ha dibujado ningún azul en la primera $n-1$ sorteos. Para la respuesta, entonces se suma sobre todos los colores.

Supongamos que $b$ de la $M$ las bolas son azules. Imagina que todas las bolas son distinguible digamos que a través de números de identificación grabados.

Hay $$M(M-1)\cdots (M-n+1)$$ secuencias de $n$ bolas, todas igualmente probable .

Hay $(M-b)(M-b-1)\cdots (M-b-(n-1)+1)$ secuencias de $n-1$ bolas no azules, y por lo tanto
$$(M-b)(M-b-1)\cdots (M-b-(n-1)+1)(b)$$ secuencias de $n-1$ no azul seguido de un azul. Divide. Para una forma más cerrada, los productos anteriores pueden expresarse utilizando coeficientes binomiales y factoriales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X