12 votos

Urna con un número infinito de bolas del finito, distribuye uniformemente los colores

Hay una urna con un número infinito de bolas, de que se puede sacar tantas veces como uno quiera. Las bolas $n$ diferentes colores, y la probabilidad de una pelota tiene un color determinado es $1/n$. Por ejemplo, si hay dos colores, rojo y verde, hay un 50% de probabilidad de que una bola sea roja, pero el problema es que el número de colores es desconocido.

Dado que una persona ha realizado $m$ sorteos, de los cuales hay $m_1$ acontecimientos de el color $c_1$, $m_2$ las ocurrencias de el color $c_2$ $\ldots$ $m_n$ las ocurrencias de color $c_n$ (de modo que $m = m_1+m_2+\cdots+m_n$, no todos necesariamente distinto de cero), ¿cómo se puede estimar el número total de colores $n$?

Si sólo hay uno de color ($n=1$), sería de esperar que para dibujar $c_1c_1c_1c_1\cdots$, pero después de un número finito de sorteos, uno sólo tiene una probabilidad de que sólo hay un color, y nunca ser ciertas. Pero, intuitivamente, uno debe ser capaz de excluir a un gran $n$s con una alta probabilidad, entonces, ¿cómo $\mathbb{P}(n\,|\,\underbrace{c_1,c_1,c_1,\ldots,c_1}_{m})$ ser distribuido, y cómo sería el caso general?

$$ \mathbb{P}(n\,|\,\underbrace{c_1,\ldots,c_1}_{m_1},\underbrace{c_2,\ldots,c_2}_{m_2},\underbrace{c_n,\ldots,c_n}_{m_n})\quad\sim\quad? $$

Hay una pregunta similar aquí, sin embargo, esta pregunta no se supone que cada color es de igual probabilidad.

2voto

kimchi lover Puntos 361

Sin un adecuado previo sobre el número de colores en la urna, de la que uno tiene que confiar en algunas ad-hoc de la receta.

La estimación de máxima verosimilitud es, creo yo, siempre que el número de colores distintos ve en la realidad.

Me gustaría ver el taper a 0 en el histograma de número de veces que cada color se ve. Si el color más raro fue visto 100 veces, me imagino que los he visto todos, pero si la más rara de colores se produjeron 3, 1, y 1 veces cada uno, yo apostaría había unos cuantos más colores para ser visto, y sería inventar una fórmula basada en la forma del cono.

0voto

Gwanguy Puntos 66

Yo se aplican aquí básico de análisis estadístico.

Lo que queremos aquí es una estimación sobre el número de colores nc, de la $m_i$ muestreo. Vamos a establecer $m=\sum_{i=1}^{cs}{m_i}$ el número de bolas tomado de la urna (cs el número de color que se ve). La estimación de la probabilidad de cada color es $m_i$/m. Pero desea estimar el número de colores, la cual es de 1 sobre la probabilidad observada para cada cs colores. Para su muestreo para el número de colores es $m/m_i$ (con i va desde 1 hasta el número de color que se ve, cs). Todas las estimaciones convergen en el mismo valor medio y deben ser todos de la misma de acuerdo a la asunción. Así, primero se debe calcular el promedio de número de colores de la estimación.

$<nc>=\frac{1}{cs}\sum_{i=1}^{cs}{\frac{m}{m_i}}$

y se puede estimar el error mediante el cálculo de la varianza:

$\sigma^2=\frac{1}{cs}\sum_{i=1}^{cs}(\frac{m}{m_i}-<nc>)^2$

y ahí lo tienen! La estimación para el número de colores es: $<nc>\pm\sigma/2$ (si se tiene una distribución de gauss para su muestreo, el 1/2 podría ser modificado para incluir el 95% de intervalo o algo así, pero la distribución es más de una distribución de Poisson, que puede ser explorada más a fondo).

Ejemplo: supongamos que tenemos la distribución de 20 bolas tomado de la urna con los colores marcados del 1 al 4:

{4, 2, 3, 4, 4, 3, 2, 4, 2, 3, 2, 4, 2, 4, 1, 4, 4, 4, 3, 1}

Si tenemos en cuenta los resultados

{{4, 9}, {2, 5}, {3, 4}, {1, 2}} lo que significa que recibe 9 bolas de color 4, 5 bolas de color 2 y así sucesivamente...

Obtenemos la toma de muestras para el número de colores ($20/m_i$):

{{4., 2.22222}, {2., 4.}, {3., 5.}, {1., 10.}}

Tenemos un promedio de la cantidad de colores de 5.30556 con un error de $\sigma/2=1.44358$, por lo que desde el 20 de bolas que tienen una estimación de 4 a 6 colores posibles.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X