Supongamos que tengo dos distribuciones normales de medidas tomadas con instrumentos diferentes. ¿Cuál es la mejor estrategia para calcular la media ponderada de dos distribuciones si se desconocen las distribuciones de error de ambos instrumentos? ¿Es posible?
Respuestas
¿Demasiados anuncios?La suma de dos variables normales independientes es una variable aleatoria normal, por ejemplo $x\sim\mathcal{N}(\mu_x,\sigma_x^2)$ et $y\sim\mathcal{N}(\mu_y,\sigma_y^2)$ te conseguirá $$\alpha x+(1-\alpha)y\sim\mathcal{N}(\alpha\mu_x+(1-\alpha)\mu_y,\alpha^2\sigma_x^2+(1-\alpha)^2\sigma_y^2)$$ En este caso, podría utilizar $\alpha=\frac{1}{2}$ para una media de igual peso.
Si se supone que ambos instrumentos son imparcial entonces la situación es más sencilla: $$x\sim\mathcal{N}(\mu,\sigma_x^2)$$ $$y\sim\mathcal{N}(\mu,\sigma_y^2)$$
En este caso se supone que en promedio ambos instrumentos son preciso (según la definición de la IUPAC), es decir, no tienen sesgo. Sin embargo, su precisión es diferente $\sigma_x,\sigma_y$ .
Construyamos un estimador ponderado $$\hat\mu=\alpha x + (1-\alpha) y$$
Veamos sus características: $$E[\hat\mu]=\alpha\mu+(1-\alpha)\mu=\mu $$
Bien, es imparcial independientemente del peso $\alpha$ es decir preciso .
Veamos cuál es su precisión : $$Var[\hat\mu]=\alpha^2\sigma_x^2+(1-\alpha)^2\sigma_y^2$$
La hipótesis de independencia de las variables normales suele ser razonable para las mediciones de los instrumentos, a menos que se vean afectadas exactamente por las mismas perturbaciones aleatorias, lo que puede ocurrir en determinadas configuraciones, pero no es lo habitual.
En este caso, el $$\alpha=\frac{\sigma_y^2}{\sigma_x^2+\sigma_y^2}$$
Se puede ver que si las precisiones son las mismas, el peso es $\alpha=1/2$ . De lo contrario, si el primer instrumento dos veces más preciso, por ejemplo. $\sigma_x=\sigma_y/2$ entonces se obtiene $$\alpha=\frac{4}{4+1}=0.8$$
Editaré esta respuesta en una más elaborada a lo largo del día.
Puedes considerar la geodésica entre tus dos densidades y recoger la distribución en la distancia media. Estas densidades tienen una geometría hiperbólica bajo la métrica de Fisher-Rao. Puedes buscar en Google SIR Costa Information Geometry para obtener cálculos detallados y expresiones de forma cerrada.