4 votos

Diferentes formas de calcular la probabilidad condicional de eventos independientes

Digamos que tenemos DOS pruebas para el cáncer. Cada prueba tiene las mismas probabilidades de ser correcta/incorrecta para cáncer/no cáncer. ¿Cuál es la probabilidad de obtener dos resultados de prueba positivos?

En lo que sigue, usaré C para "tiene cáncer", "+" para un resultado de prueba positivo, "++" para dos positivos (no distingo entre las pruebas porque tienen las mismas probabilidades).

A. Usa la fórmula para la probabilidad total:

P(++) = P(++|C) $\times$ P(C) $+$ P(++|$\neg$C) $\times$ P($\neg$C)

Dado que cada prueba es independiente de la otra, aplica la fórmula para la probabilidad conjunta:

\= P(+|C)$^2$ $\times$ P(C) $+$ P(+|$\neg$C)$^2$ $\times$ P($\neg$C)

B. Dado que cada prueba es independiente de la otra, la probabilidad conjunta es el producto de la probabilidad de cada una (que es la misma):

P(++) = P(+)$^2$

Luego, aplica la fórmula para la probabilidad total a cada una:

\= [P(+|C) $\times$ P(C) $+$ P(+|$\neg$C) $\times$ P($\neg$C)]$^2$

Obviamente, las dos no son iguales. ¿Por qué no? ¿Y cuál es la correcta?

5voto

Mark Ransom Puntos 132545

Los dos tests no son absolutamente independientes. Son condicionalmente independientes en C.

Pensándolo de forma intuitiva, si das positivo en el primer test, podemos predecir que es más probable que des positivo en el segundo test, por lo tanto los dos no son absolutamente independientes.

Sin embargo, dado que sabes que tienes cáncer, los dos tests son independientes, es decir, saber el resultado del primero no afectará nuestra predicción del resultado del segundo. Por lo tanto, "independencia condicional".

4voto

timday Puntos 517

La respuesta de Jason es ciertamente verdadera, pero no creo que explique completamente la razón por la que tus fórmulas no coinciden, sino solo por qué no querrías aplicar esta lógica en el caso específico de las pruebas de cáncer.

En lugar de + y ++, generalicemos esto a eventos $A,B,C$. Tu segundo cálculo asume $P(AB)=P(A)P(B)$, es decir, que $A$ y $B$ son marginalmente independientes, lo cual está de acuerdo con tu suposición (aunque esa suposición no se cumpliría para las pruebas de cáncer).

Tu primer cálculo, sin embargo, asume $P(AB|C) = P(A|C) P(B|C)$, es decir, que $A$ y $B$ son condicionalmente independientes dado $C$. Estas NO son lo mismo y en general una no implica la otra. Esto es fácil de ver en el caso gaussiano: las variables aleatorias gaussianas son independientes si y solo si su correlación es 0, pero son condicionalmente independientes dadas otras variables si y solo si su correlación parcial es 0. Configurar una matriz de correlación con algunos ceros e invertirla para encontrar la matriz de correlación parcial es una buena manera de ver cómo se relacionan estas dos cantidades y que NO son intercambiables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X