Tengo algunas medidas $\vec{x}$ para algún valor del mundo real $\hat{x}$ . Estas mediciones tienen cierta incertidumbre y están correlacionadas. Dadas estas estimaciones, y sus covarianzas, quiero tomar algún tipo de media ponderada de las estimaciones
$$\bar{x} = \sum_i w_i x_i = \vec{w} \cdot \vec{x}$$
Naturalmente, quiero que mis pesos sumen 1:
$$\sum_i w_i = 1 = \vec{w} \cdot \vec{1}$$
Quiero elegir mis pesos de tal manera que mi incertidumbre en torno a esta estimación sea lo más baja posible, por lo que quiero minimizar:
$$\mathbb{E} \left[ \left( \bar{x} - \hat{x} \right)^2 \right] = \sum_i \sum_j w_i w_j C_{i,j} = \vec{w}^T C \vec{w}$$
donde $C$ es la matriz de covarianza de los errores de mis mediciones: $C_{i,j}=\mathbb{E} \left[ x_i - \hat{x}, x_j - \hat{x} \right]$ . Minimizar esto bajo la restricción de que los pesos sumen 1 se puede hacer usando un multiplicador de Lagrange, y (asumiendo que hice todo bien) resulta en:
$$ C \cdot \vec{w^*} = \vec{1}$$ $$ \vec{w} = \vec{w^*} / \sum \vec{w^*} $$
Obsérvese que este último paso consiste simplemente en reescalar $\vec{w^*}$ sume 1, así que me interesa sobre todo la solución de $\vec{w^*}$ :
$$ \vec{w^*} = C^{-1} \cdot \vec{1}$$
Este procedimiento da como resultado ponderaciones negativas. Esto no tiene sentido para mí intuitivamente. (Por ejemplo, si sólo tengo una estimación $x_1$ de 100, entonces obviamente mi estimación total $\bar{x}$ también será de 100. ¿Cómo podría la introducción de otra medida, de 110, hacer que mi estimación global $\bar{x}$ disminuye por debajo de 100?) Así que sospecho que estoy haciendo algo mal, como utilizar una matriz de covarianza incoherente. Pero, ¿es definitivo ¿que estoy haciendo algo mal?
¿Puede el procedimiento anterior razonablemente devolver pesos negativos? ¿Qué sentido tendría esto en términos de las implicaciones reales de lo que estoy intentando hacer (tomar una media ponderada de múltiples estimaciones)?