14 votos

¿Cuántos libros hay en la biblioteca?

Mi primo está en la escuela primaria y cada semana se les da un libro por su maestro. Luego lo lee y lo devuelve en el tiempo para obtener otro de la próxima semana. Después de un rato empezó a notar que le estaba poniendo los libros que había leído antes y esto se convirtió poco a poco más común a lo largo del tiempo. Naturalmente, me empecé a preguntar cómo se puede estimar el número total de libros en su biblioteca.

Dicen que el verdadero número de libros en la biblioteca es $N$ y el maestro elige un uniformemente al azar (con reemplazo) para dar a cada semana. Si en la semana $t$ ha recibido un libro que han leído antes de $x$ a veces, hay un estimador imparcial para el número total de libros en la biblioteca y lo que es la varianza de este estimador? Hay otro estimador sesgado con menor variación?

En mi primo del caso, en la primera $30$ semanas recibió un libro del que había recibido antes de $3$ veces.

7voto

Mischa Puntos 26200

El Good-Turing estimación está dada por $$\hat M ={N \over {1-{N_1 \over K}}}$$ where $N$ is the number of different names observed, $N_1$ is the number of names seen once, and $K$ is the total number of observations. For your data, assuming 24 observations were unique and the 3 duplicates were all seen twice, this yields $$\hat M = {27 \over {1-{24 \over 30}}}= 135.$$ yo no sé acerca de el error estándar de esta estimación, buscar Good-Turing y ver lo que puedes encontrar.

5voto

Nikolai Prokoschenko Puntos 2507

Dado que hay $N$ libros en total y $t$ semanas, la probabilidad de haber recibido $x$ duplicados (es decir, $t-x$ único libros) es $$S_2(t,t-x) \frac{ N!}{(N-(t-x))! N^t}$$ where $S_2$ denotes a Stirling number of the second kind. In your example $S_2(30,27)=10359090$.

La estimación de máxima verosimilitud de $N$$t=30$$x=3$$135$. Si realmente existían $N=135$ libros, a continuación, el número esperado de duplicados sería de alrededor de $3.01017$, mientras que si no se $N=136$ libros, a continuación, el número esperado de duplicados sería de alrededor de $2.98951$. El valor de$N$, lo que daría exactamente $3$ es de alrededor de $135.4907$, aunque por supuesto, este no es un entero.

Por lo $135$ es una estimación razonable. Pero todavía hay una considerable incertidumbre: cualquier valor de $N$ $56$ $601$tendría una probabilidad de $3$ duplicados de $30$ más de un décimo de la probabilidad resultante de $N=135$. La varianza para el número de duplicados si $N=135$ es de alrededor de $2.26258$.

4voto

Did Puntos 1

El libro elegido en la semana $t$ nunca fue escogido antes si, de forma independiente e $t-1$ tiempos, otro libro fue uno de los elegidos. Esto ocurre con probabilidad de $p^{t-1}$ donde $p=1-N^{-1}$. Por lo tanto, el número medio de semanas hasta la semana $t$ cuando el libro elegido no era nueva es $$ W_t=\sum_{s=1}^t\left(1-p^{m-1}\right)=t-\frac{1-p^t}{1-p}, $$ es decir, $$ t-W_t=N\cdot(1-(1-N^{-1})^t).\la etiqueta{$\ast$} $$ El RHS aumenta de $1$ al $N=1$ $t$al $N=\infty$ y el libro elegido en la semana $1$ es siempre uno nuevo, por lo tanto $0\leqslant W_t\leqslant t-1$. Para cada observó $W_t$$\{0,1,\ldots,0,t-1\}$, no existe un único $\hat N_t$ tal que $(\ast)$ mantiene.

El valor exacto de $\hat N_t$ no tiene expresión algebraica al $t$ es grande pero, en el límite de $t\to\infty$$W_t/t\to\mathtt w$, uno sabe que $\hat N_t/t$ converge a la única solución de $\nu$ de la ecuación $$ \nu\cdot(1-\mathrm e^{-1/\nu})=1-\mathtt w.\la etiqueta{$\dagger$} $$ Numéricamente, si $t=30$ y $W_t=3$, $(\ast)$ rendimientos $\hat N_t=135.49$ por lo tanto, uno podría concluir que $N=135$ o $N=136$, y la aproximación a $(\dagger)$ $\mathtt w=1/10$ rendimientos $\nu t=139.8$, que no está demasiado lejos de la marca aunque $t=30$ es relativamente pequeña (tenga en cuenta que $\nu t$ siempre sobrestima $\hat N_t$, debido a la convexidad).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X