Dejemos que $X$ sea una variable aleatoria que tiene $n$ valores posibles $x_1,x_2,\dots,x_n$ y que $P(X=x_i)=\frac 1n ,\forall x=1\dots n$ .
Tenga en cuenta que $n$ y $x_i,i=1\dots n$ son todos desconocidos y $x_i$ es desordenado pero con dos resultados cualesquiera $a_i, a_j\in\{x_1\dots x_n\}$ , se puede saber si son del mismo valor.
Supongamos que se ha observado el suceso aleatorio $m$ veces, y $p$ valores diferentes $a_1, a_2, \dots, a_p$ se han observado, apareciendo cada valor $c_1, c_2, \dots, c_p$ tiempos. Aparentemente hay $c_i>0$ y $\sum c_i=m$ . Supongamos que $p$ es significativamente menor que $n$ ( $p<<n$ ). Teniendo en cuenta que cada $x_i$ tienen la misma posibilidad de $\frac 1n$ de aparecer para una sola prueba (observación) y el conjunto $\{c_i\}$ cómo hacer una estimación no sesgada de $n$ ?
Una versión más fácil de entender:
Estás jugando a una máquina tragaperras con una sola ranura. No sabe cuántos elementos diferentes hay en la ranura, pero sabe que la máquina no tiene trampa y que cada elemento posible tiene la misma probabilidad de aparecer en cada tirada. Has hecho rodar la máquina tragaperras por $m$ veces y visto $p$ diferentes artículos. Usted cuenta sus resultados y ve que cada artículo ha aparecido por $c_i$ veces. Sabes que la máquina tragaperras tiene muchos más artículos disponibles de los que has visto. ¿Cómo puede hacer una estimación no sesgada del número total de artículos en el rollo de la tragamonedas?
Soy consciente de la Problema de los tanques alemanes pero descubrí que el mío es muy diferente en muchos aspectos, como que los resultados del evento aleatorio no están ordenados y que las estadísticas de los resultados observados son importantes, por lo que no pude aplicar el modelo del tanque alemán y resolverlo por mí mismo.
También estoy asumiendo que el patrón es "típico", de manera que muy pocos artículos aparecen algunas veces más (por encima de 3 o 4), y un poco más de artículos que aparecen dos o tres veces, y la gran mayoría que aparecen sólo una vez.
Descargo de responsabilidad: Esto no está relacionado de ninguna manera con el trabajo escolar. Se me ocurrió esta pregunta mientras jugaba con el ordenador.