5 votos

Número esperado de unidades en una población no uniformemente distribuida

Me pregunto si hay alguna forma razonablemente sencilla de calcular el siguiente problema:

Dibujo, con sustitución, $n$ bolas de un contenedor de $N$ bolas de diferentes colores, con una probabilidad conocida de sacar cada color de bola, cuál es el número esperado de bolas "únicas", es decir, bolas con ninguna otra bola del mismo color?

Por ejemplo
$P(red) = 0.25$
$P(blue) = 0.3$
$P(green) = 0.2$
$P(yellow) = 0.25$

Algunos ejemplos de resultados con 5 bolas:

$\{red, red, green, blue, yellow\}$ - 3 bolas únicas
$\{red, red, green, green, blue\}$ - 1 bola única
$\{blue, blue, blue, yellow, yellow\}$ - 0 bolas únicas

O, con 3 bolas:

$\{red, green, blue\}$ - 3 únicos
$\{red, red, blue\}$ - 1 único
$\{red, red, red\}$ - 0 único

Para 1 bola, es trivialmente 1; para 2 bolas, es 1 - la probabilidad de los resultados en los que las dos bolas son del mismo color * 2 bolas, después empieza a complicarse.

8voto

jldugger Puntos 7490

Dejemos que $X_i$ sea la variable aleatoria igual a $1$ cuando hay exactamente una bola de color $i$ ( $i = 1, 2, \ldots, m$ para evitar confusiones, escribo $m$ en lugar de $N$ ). El recuento del color $i$ sigue a una Binomial( $p_i$ , $n$ ), lo que implica la expectativa de $X_i$ es

$$\eqalign{ \mathbb{E}[X_i] = &\sum_{j=0}^{n} \binom{n}{j} p_i^j (1-p_i)^{n-j} X_i(j) \cr = &\binom{n}{1} p_i (1-p_i)^{n-1} \cr = &n p_i (1-p_i)^{n-1}. }$$

El número de colores únicos es la suma de los $X_i$ . Como la expectativa es lineal, obtenemos

$$\eqalign{ \mathbb{E}[X] = &\sum_{i=1}^{m}\mathbb{E}[X_i] = \sum_{i=1}^{m}n p_i (1-p_i)^{n-1} \cr = &n\sum_{i=1}^{m} p_i (1-p_i)^{n-1}. }$$

4voto

Marc-Andre R. Puntos 789

Voy a dar el esquema de la solución. Los números de cada bola de color en un sorteo siguen una distribución multinomial como ha señalado tshauck. Sea $R$ denotan el número de bolas rojas, $G$ - número de bolas verdes, $B$ - número de bolas azules y $Y$ - número de bolas amarillas en el sorteo del tamaño $n$ . Entonces la probabilidad de que en el sorteo aleatorio tengamos exactamente $x_1$ bolas rojas, $x_2$ bolas verdes, $x_3$ bolas azules y $x_4$ la bola amarilla es

$$P(R=x_1,G=x_2,B=x_3,Y=x_4)=\frac{n!}{x_1!x_2!x_3!x_4!}p_r^{x_1}p_g^{x_2}p_b^{x_3}p_y^{x_4}$$

donde $p_r$ es la probabilidad de elegir la bola roja, $p_g$ - verde, $p_b$ - azul, $p_y$ - amarillo.

Denote el número de bolas únicas en un sorteo por $U$ . Entonces $U=f(R,G,B,Y)$ . Como se tiene la distribución del vector $(R,G,B,Y)$ se puede calcular la distribución de $U$ . Como tenemos cuatro colores $U$ puede obtener valores $0,1,2,3,4$ . Así que para obtener la probabilidad de que $U=0$ hay que encontrar todas las combinaciones posibles de $(R,G,B,Y)$ para lo cual $U=0$ y sumar las probabilidades de estas combinaciones. Así, cuando $U=0$ ? Cuando

  1. Todas las bolas aparecen más de una vez: $R>1$ , $G>1$ , $B>1$ , $Y>1$

  2. Un color está ausente y todos los demás aparecen más de una vez

    a. $R=0$ , $G>1$ , $B>1$ , $Y>1$

    b. $R>1$ , $G=0$ , $B>1$ , $Y>1$

    c. $R>1$ , $G>1$ , $B=0$ , $Y>1$

    d. $R>1$ , $G>1$ , $B>1$ , $Y=0$

  3. Dos colores están ausentes y todos los demás aparecen más de una vez. $6$ casos

  4. Faltan tres colores, todo el sorteo es de un solo color. $4$ casos

Los cuatro casos son mutuamente excluyentes, por lo que se pueden sumar las probabilidades. Los casos de $U=1,2,3,4$ pueden ser tratados de forma similar.

Por supuesto, no es una solución elegante, pero no veo por qué no debería funcionar. Sugiero preguntar esto en math.stackexchange.com .

Actualización 1

Este enfoque sirve para calcular la distribución de probabilidad de $U$ . Para el valor esperado de $U$ - La respuesta de Whuber es la correcta.

1voto

titanae Puntos 1481

Tal vez sea un ingenuo, pero ¿no funcionaría la Distribución Multinomial para esto?

P(1 único) = P(1 Azul) + P(1 Rojo) + P(1 Azul), probablemente hay muchos detalles que habría que rellenar, como P(1 Azul) = La distribución multinomial para todas las combinaciones posibles de las otras combinaciones de bolas en las que hay un azul.

http://en.wikipedia.org/wiki/Multinomial_distribution

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X