Considere el siguiente problema:
Tenemos una colección de m blanco y n bolas negras. Elegimos k bolas ( k m + n ) sin de reemplazo. ¿Cuál es el número esperado de bolas blancas en la muestra?
Método de recuento 1: La proporción de bolas blancas en la colección es m /( m + n ). Si muestreamos repetidamente la colección, esperamos que, por término medio, nuestra muestra tenga la misma proporción. Por lo tanto, el número esperado de bolas blancas en una muestra de tamaño k es km /( m + n ).
As a side note, I think the above argument somehow depends on the unbiasedness of
the mean estimator. Am I right?
Método de recuento 2: Calculamos directamente el número esperado de bolas blancas en la muestra:
$$ \frac{\sum_{i=0}^{k} i\binom{m}{i}\binom{n}{k-i}}{\binom{m+n}{k}} \enspace.$$
Entonces, llegamos a la identidad: $$ \sum_{i=0}^{k} i\binom{m}{i}\binom{n}{k-i} = \frac{km}{m+n}\binom{m+n}{k} \enspace.$$
¿Cómo se puede demostrar el resultado anterior sin contar dos veces?
Parece que se puede probar utilizando La identidad de Vandermonde así como $i\binom{m}{i} = m\binom{m-1}{i-1}$ . Pero, ¿existe un enfoque más sencillo (que no dependa de identidades adicionales como la de Vandermonde)?