4 votos

Diferentes formas de calcular la probabilidad condicional de eventos independientes

Digamos que tenemos DOS pruebas para el cáncer. Cada prueba tiene las mismas probabilidades de ser correcta/incorrecta para cáncer/no cáncer. ¿Cuál es la probabilidad de obtener dos resultados positivos en las pruebas?

En lo que sigue, usaré C para "tiene cáncer", "+" para un resultado positivo en la prueba, "++" para dos positivos (no distingo entre las pruebas porque tienen las mismas probabilidades).

A. Utilizar la fórmula para la probabilidad total:

P(++) = P(++|C) $\times$ P(C) $+$ P(++|$\neg$C) $\times$ P($\neg$C)

Dado que cada prueba es independiente de la otra, aplicar la fórmula para la probabilidad conjunta:

\= P(+|C)$^2$ $\times$ P(C) $+$ P(+|$\neg$C)$^2$ $\times$ P($\neg$C)

B. Dado que cada prueba es independiente de la otra, la probabilidad conjunta es el producto de la probabilidad de cada una (que es la misma):

P(++) = P(+)$^2$

Luego, aplicar la fórmula para la probabilidad total a cada una:

\= [P(+|C) $\times$ P(C) $+$ P(+|$\neg$C) $\times$ P($\neg$C)]$^2$

Obviamente, las dos no son iguales. ¿Por qué no? ¿Y cuál es la correcta?

5voto

Mark Ransom Puntos 132545

Las dos pruebas no son absolutamente independientes. Son condicionalmente independientes en C.

Pensándolo de manera intuitiva, si das positivo en la primera prueba, podemos predecir que es más probable que des positivo en la segunda prueba, por lo tanto, las dos no son absolutamente independientes.

Sin embargo, dado que sabes que tienes cáncer, las dos pruebas son independientes, es decir, saber el resultado de la primera no afectará nuestra predicción del resultado de la segunda. Por lo tanto, "independencia condicional".

4voto

timday Puntos 517

La respuesta de Jason es ciertamente verdadera, pero no creo que explique completamente la razón por la cual tus fórmulas no coinciden, sino solo por qué no querrías aplicar esta lógica en el caso específico de pruebas de cáncer.

En lugar de + y ++, generalicemos esto a eventos $A,B,C$. Tu segundo cálculo asume $P(AB)=P(A)P(B)$, es decir, que $A$ y $B$ son independientes de manera marginal, lo cual está de acuerdo con tu suposición (aunque esta suposición no se cumpliría para pruebas de cáncer).

Tu primer cálculo, sin embargo, asume $P(AB|C) = P(A|C) P(B|C)$, es decir, que $A$ y $B$ son condicionalmente independientes dado $C$. Estos NO son lo mismo y en general uno no implica el otro. Esto es fácil de ver en el caso gaussiano: variables aleatorias gaussianas son independientes si y solo si su correlación es 0, pero son condicionalmente independientes dadas otra si y solo si su correlación parcial es 0. Configurar una matriz de correlación con algunos ceros y invertirla para encontrar la matriz de correlación parcial es una buena manera de ver cómo se relacionan estas dos cantidades y que NO son intercambiables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X