Para ponderar la varianza $$\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2$$ existe el sesgo corregido varianza de la muestra, cuando la media fue estimado a partir de los mismos datos: $$\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2$$
Estoy mirando ponderada de la media y la varianza, y se pregunta cuál es la adecuada corrección del sesgo de la varianza ponderada. El uso de: $$\text{mean}(X):=\frac{1}{\sum_i \omega_i}\sum_i \omega_i x_i$$
El "ingenuo", no-corregida la varianza estoy usando es este: $$\text{Var}(X):=\frac{1}{\sum_i \omega_i}\sum_i\omega_i(x_i - \text{mean}(X))^2$$
Por eso me pregunto si la forma correcta de corregir el sesgo es
A) $$\text{Var}(X):=\frac{1}{\sum_i \omega_i - 1}\sum_i\omega_i(x_i - \text{mean}(X))^2$$
o B) $$\text{Var}(X):=\frac{n}{n-1}\frac{1}{\sum_i \omega_i}\sum_i\omega_i(x_i - \text{mean}(X))^2$$
o C) $$\text{Var}(X):=\frac{\sum_i \omega_i}{(\sum_i \omega_i)^2-\sum_i \omega_i^ 2}\sum_i\omega_i(x_i - \text{mean}(X))^2$$
A) no tiene sentido para mí cuando los pesos son pequeños. La normalización de valor puede ser 0 o incluso negativo. Pero ¿qué hay de B) ($n$ es el número de observaciones) - este es el enfoque correcto? ¿Tienes alguna referencia que muestra esto? I belive "Actualización de la media y la varianza de las estimaciones: un método mejorado", D. H. D. West, 1979 utiliza este. La tercera, C) es mi interpretación de la respuesta a esta pregunta: http://mathoverflow.net/questions/22203/unbiased-estimate-of-the-variance-of-an-unnormalised-weighted-mean
C) me acabo de dar cuenta que el denominador se parece mucho a $\text{Var}(\Omega)$. ¿Hay alguna conexión general aquí? Creo que no del todo se alinee; y, obviamente, no es la conexión que estamos tratando de calcular la varianza...
Todos los tres de ellos se parecen a "sobrevivir" a la cordura de verificación de la configuración de todos los $\omega_i=1$. Así que debo utilizar, en virtud de que el local? "Actualización:" whuber propuso también hacer la comprobación de validez de los con $\omega_1=\omega_2=.5$ y el resto de las $\omega_i=\epsilon$ pequeña. Esto parece descartar a y B.