Supongamos que $w_1,w_2,\ldots,w_n$ y $x_1,x_2,...,x_n$ se dibujan cada uno de ellos i.i.d. de algunas distribuciones, con $w_i$ independiente de $x_i$ . El $w_i$ son estrictamente positivos. Se observan todas las $w_i$ pero no el $x_i$ sino que observas $\sum_i x_i w_i$ . Estoy interesado en estimar $\operatorname{E}\left[x\right]$ de esta información. Es evidente que el estimador $$ \bar{x} = \frac{\sum_i w_i x_i}{\sum_i w_i} $$ es insesgada y puede calcularse con la información disponible.
¿Cómo puedo calcular el error estándar de este estimador? Para el subcaso en el que $x_i$ sólo toma los valores 0 y 1, probé ingenuamente $$ se \approx \frac{\sqrt{\bar{x}(1-\bar{x})\sum_i w_i^2}}{\sum_i w_i}, $$ básicamente ignorando la variabilidad de la $w_i$ pero se comprobó que su rendimiento era escaso para tamaños de muestra inferiores a 250 aproximadamente. (Y esto probablemente depende de la varianza de la $w_i$ .) Parece que no tengo suficiente información para calcular un error estándar "mejor".