1 votos

Combinar un conjunto de probabilidades condicionales

Me interesa combinar un conjunto de probabilidades condicionales en una sola. Por ejemplo, si conozco las siguientes probabilidades:

  • P(illness|male)
  • P(illness|region_1)
  • P(illness|age_group_3)

Sabiendo que un hombre vive en region_1 y tiene una edad que pertenece al age_group_3 ¿Cómo puedo calcular su probabilidad de estar enfermo? P(illness|male,region_1,age_group_3) (¿es esta la sintaxis correcta?) ? En este caso, se puede suponer que las probabilidades son independientes.

1voto

JSJ Puntos 3628

Tu sintaxis está bien, aunque es más típico considerar probabilidades condicionales de la forma P(M | X) en lugar de la forma en que lo has expresado. Sin embargo, necesitarías alguna información adicional para resolver tu problema (es decir, tu problema está infra-restringido). Consideremos un caso más sencillo en el que sólo tenemos dos condiciones: el sexo y la ubicación, ambas con sólo dos posibilidades:

X={0,1} es el estado de enfermedad

A = {M, F} es masculino/femenino

B= {R1, R2} es la región 1 o la región2

Dado el mismo conjunto de información de entrada, podemos generar varias tablas de probabilidad conjuntas diferentes. Como datos de entrada consideremos:

P(X=1)=0,15

P(M)=P(F)=0,5

P(R1)=0,2

P(R2)=0,8

P(X|M)=0,1,

así que P(X,M)=0,1*0,5=0,05

P(X|F)=0,2,

así que P(X,F)=0,2*0,5=0,1

P(X|R1)=0,5,

así que P(X,R1)=0,5*0,2=0,1

P(X|R2)=1/16,

así que P(X,R2)=1/16*0,8=0,05

Consideremos ahora la tabla de probabilidad conjunta cuando X=1. La información que tenemos significa que debe tener la siguiente forma:

$$\begin{array}{c|c|c|} X=1 & \text{M} & \text{F} & \text{Both} \\ \hline \text{R1} & a & b & 0.1 \\ \hline \text{R2} & c & d & 0.05\\ \hline \text{Both} & 0.05 & 0.1 & 0.15\\ \hline \end{array}$$

Donde las entradas de la tabla son las probabilidades conjuntas P(X=1,M,R1), etc. Obsérvese que no tenemos más restricciones que aplicar a las incógnitas a, b, c, d. Se trata de un sistema con pocas restricciones. Para ver esto numéricamente sólo tenemos que demostrar que hay dos (o más) tablas posibles que satisfacen nuestras restricciones. Por ejemplo

Tabla de probabilidad conjunta 1

$$\begin{array}{c|c|c|} X=1 & \text{M} & \text{F} & \text{Both} \\ \hline \text{R1} & 0 & 0.1 & 0.1 \\ \hline \text{R2} & 0.05 & 0 & 0.05\\ \hline \text{Both} & 0.05 & 0.1 & 0.15\\ \hline \end{array}$$

Tabla de probabilidad conjunta 2

$$\begin{array}{c|c|c|} X=1 & \text{M} & \text{F} & \text{Both} \\ \hline \text{R1} & 0.05 & 0.05 & 0.1 \\ \hline \text{R2} & 0 & 0.05 & 0.05\\ \hline \text{Both} & 0.05 & 0.1 & 0.15\\ \hline \end{array}$$

La razón es que P(X=1|M) le da información promediada sobre los machos en ambas regiones, pero no dice nada sobre cómo se distribuyen los machos con la condición en las dos regiones. Esto no rompe la independencia de la región y el género: sigue habiendo un 50% de hombres en cada región, sólo que en una región todos ellos pueden estar sanos. Lo mismo ocurre con todas las demás expresiones de la forma P(X=1| ???).

TLDR - Necesitas más información para especificar (sin ambigüedades) las probabilidades por las que preguntas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X