Imagina que tengo una distribución no normalizada $P$ con función de densidad $p(x)$ para $x \in \mathbb{R}^d$ . $P$ tiene dos modos bien separados y hay dos conjuntos de muestras i.i.d. con el tamaño $n$ que cada uno de ellos ha sido tomado de uno de los modos. Me gustaría saber cómo puedo combinar estas muestras de forma insesgada. En otras palabras $\hat{\mu}_i$ sea la estimación empírica de $\mu_i$ entonces me gustaría encontrar el $w_i$ que minimice el siguiente error:
$\min \quad (\sum_{i}w_i(\hat{\mu}_i-\mu_i))^2$
Gracias por su ayuda.
Saludos