Supongamos que $w_1,w_2,\ldots,w_n$ y $x_1,x_2,...,x_n$ se extraen i.i.d. de algunas distribuciones, con $w_i$ independiente de $x_i$. Los $w_i$ son estrictamente positivos. Observas todos los $w_i$, pero no los $x_i$; en su lugar, observas $\sum_i x_i w_i$. Estoy interesado en estimar $\operatorname{E}\left[x\right]$ a partir de esta información. Claramente, el estimador $$ \bar{x} = \frac{\sum_i w_i x_i}{\sum_i w_i} $$ es insesgado, y se puede calcular dados los datos disponibles.
¿Cómo podría calcular el error estándar de este estimador? Para el subcaso donde $x_i$ toma solo valores 0 y 1, intenté ingenuamente $$ se \approx \frac{\sqrt{\bar{x}(1-\bar{x})\sum_i w_i^2}}{\sum_i w_i}, $$ básicamente ignorando la variabilidad en los $w_i$, pero encontré que esto funcionaba mal para tamaños de muestra menores a alrededor de 250. (Y esto probablemente depende de la varianza de los $w_i$.) Parece que tal vez no tengo suficiente información para calcular un error estándar 'mejor'.