10 votos

Combinación de dos distribuciones de probabilidad

Tengo una variable $X$ . En una medición $A$ , $X$ sigue la distribución normal $N_1$ con la media $m_1$ y la desviación estándar $\sigma_1$ . En una medición similar $B$ , $X$ sigue otra distribución normal $N_2$ con la media $m_2$ y la desviación estándar $\sigma_2$ . En este caso, ¿cuál será la distribución de probabilidad combinada o conjunta de $X$ ? ¿Será $N_1+N_2$ o $N_1 N_2$ ?

(Adición) Supongamos $A$ y $B$ son medidas independientes. Podemos pensar en una situación en la que un medidor $A$ viene y mide la distribución de $X$ y a continuación una persona $B$ viene y mide de nuevo la distribución. Ambos medidores miden de forma independiente. La pregunta es cuál será la verdadera distribución de probabilidad de $X$ en este caso? Suponemos que la medición de $A$ y $B$ son igualmente fiables.

(Parafraseando un comentario de r.e.s.) Si la persona C recibe informes de los observadores A y B, igualmente fiables, en los que se exponen sus respectivos juicios independientes sobre X (en la forma de las distribuciones normales indicadas), ¿cómo combina C estos informes para formar un juicio justo e imparcial sobre X?

6voto

sayth Puntos 572

El trabajo de Clemen & Winkler no es para esta situación. Por ejemplo, si $P=(1,0,0,0)$ es una distribución de probabilidad sobre un $4$ -y el conjunto de elementos $Q=(0.5, 0.3, 0.2, 0)$ es otra distribución de probabilidad obtenida independientemente sobre ese conjunto, entonces la distribución de probabilidad $F(P,Q)$ que resulta de la combinación de la información en $P$ y $Q$ , debe ser $(1,0,0,0)$ porque $P$ ya tiene información concluyente sobre los elementos del conjunto, que no puede ser "mejorada" por otra observación. En otras palabras, cualquier $0$ -valor que se produce en $P$ (o $Q$ ) debe dar lugar a un $0$ -valor en $F(P,Q)$ en la misma posición (la misma para cualquier $1$ -valor se desprende lógicamente de esto). Además, la identidad de $F$ debe ser la distribución uniforme $(0.25, 0.25, 0.25, 0.25)$ , ya que es la distribución más inconclusa. Agregando $P$ y $Q$ tomando su media aritmética o geométrica ponderada no lo consigue, como en la mayoría de los trabajos como Clemen & Winkler. ¿Podría alguien sugerir cómo una función de este tipo $F$ ¿se debe definir? Debemos asumir que $P$ y $Q$ son consistentes, es decir, si uno de ellos tiene un $0$ -valor en una determinada posición, entonces el otro no tiene un $1$ -valor en la misma posición, porque nuestras dos observaciones no pueden contradecirse. No soy un experto en teoría de la probabilidad, así que les ruego que disculpen cualquier uso inexacto de la terminología. Agradecería cualquier ayuda para encontrar tal $F$ . Gracias.

6voto

Diana Grimaldi Puntos 11

La cantidad que solicita es la conjunta distribución de probabilidades $P(x_A,x_B)$ es decir, la probabilidad de que $A$ observa $x_A$ mientras que al mismo tiempo $B$ observa $x_B$ . Ha especificado que el observador $A$ ve una distribución normal, en otras palabras estás diciendo $$ \int P(x_A,x_B) dx_B = N(x_A;m_A,\sigma_A) = \frac{1}{\sigma_A\sqrt{2\pi}} e^{-\frac{(x_A-m_A)^2}{2\sigma_A^2}} $$ entonces nos dices que el observador B ve un resultado similar con media y sigma posiblemente diferentes: $$ \int P(x_A,x_B) dx_A = N(x_B;m_B,\sigma_B) = \frac{1}{\sigma_B\sqrt{2\pi}} e^{-\frac{(x_B-m_B)^2}{2\sigma_B^2}} $$ donde he utilizado los subíndices $A,B$ en lugar de $1,2$ para indicar las observaciones respectivas.

La suposición de que las observaciones son estadísticamente independientes significa que $$ P(x_A,x_B) = P(x_A)\,P(x_B), $$ que satisface trivialmente las relaciones integrales anteriores como $N_1,N_2$ están normalizados. Así que para responder a su pregunta inicial, la respuesta correcta es $N_1 N_2$ . Nunca se suman distribuciones de probabilidad a menos que las observaciones sean mutuamente excluyentes. En otras palabras $N_1+N_2$ sólo podría haber sido la respuesta si cuando $A$ hace una observación, hay no es observación correspondiente de $B$ . Se puede ver que hay un problema adicional que es que la suma ni siquiera está normalizada, por lo que no podría haber sido la respuesta.

Dado que ha especificado el problema en términos de relaciones integrales, hay otras respuestas posibles si no se asume la independencia estadística. Considere, por ejemplo, una distribución normal multivariante que puede satisfacer las relaciones integrales anteriores aunque no sea separable. También se puede hacer que la distribución normal multivariante sea elíptica, siempre que las proyecciones sobre los dos ejes de coordenadas se mantengan fijas. En otras palabras, podría haber una matriz de correlación no diagonal. Siempre hay que comprobar la matriz de correlación para las medidas reales, porque a veces se puede tener una medida muy precisa en una dirección no diagonal como $x_A+x_B$ pero errores muy grandes en la dirección ortogonal ( $x_A-x_B$ ), y esto se mostraría como errores mediocres en ambos ejes cuando se proyecta en los ejes de coordenadas.

3voto

Lukess Puntos 21

Citando un comentario anterior de r.e.s.:

Un ejemplo de la literatura es " Agregación de distribuciones de probabilidad "por R. Clemen y R. Winkler. (Puede ser el mismo que el capítulo 9 de " Avances en el análisis de decisiones: de los fundamentos a las aplicaciones "por Ward Edwards, Ralph F. Miles y Detlof Von Winterfeldt). Obsérvese, en particular, el planteamiento del pool de agregación lineal (p. 7).

0voto

AbuBakr Puntos 86

Sé que las preguntas han estado un poco inactivas desde hace algún tiempo, pero yo también estaba reflexionando sobre estas preguntas. Pensé que podría aportar algo a la discusión y me gustaría ver lo que otros usuarios piensan sobre mi respuesta.

Especialmente la adición a la pregunta y su paráfrasis me hicieron pensar que se podría seguir el enfoque bayesiano y definir pesos a priori sobre cada experimento para definir la distribución de probabilidad posterior. Dejemos que los pesos sobre cada una de las mediciones sean $\lambda_1, \lambda_2 \geq 0$ la distribución combinada podría ser entonces:

$$ \dfrac{\lambda_1}{\lambda_1 + \lambda_2} N_1 + \dfrac{\lambda_2}{\lambda_1 + \lambda_2} N_2 $$

Por supuesto, el planteamiento no es compatible con la respuesta de Ravji Bagai, pero quién sabe la precisión de $P$ o $Q$ ?

-1voto

John Liu Puntos 1

Se trata del problema estándar de combinar dos pruebas independientes mediante la regla de combinación de Dempster en las funciones de creencia. Consulte la teoría de la función de creencia lineal en Wikipedia para conocer la fórmula de combinación de dos distribuciones normales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X