5 votos

Encontrar la probabilidad de que alguien tenga la enfermedad, dado que dan positivo en dos pruebas

Esta pregunta es de el libro de texto "Introducción a la Probabilidad - Blitzstein & Hwang."

Yo estaba estudiando para una clase cuando me encontré con un problema de ejemplo que he resuelto, pero tengo un poco diferente resultado que el libro de texto. Aquí está el problema en cuestión, parafraseado:

$\ $

"Fred pruebas para una enfermedad que afecta a 1% de la población. La prueba de la exactitud se considera que el 95%. Prueba positiva para la primera prueba, pero decide hacerse la prueba una segunda vez. Por desgracia, Fred también positivo para la segunda prueba. Encontrar la probabilidad de que Fred tiene la enfermedad, dada la evidencia."

$\ $

Mi planteamiento es el siguiente:

Deje $D$ ser el caso de que Fred tiene la enfermedad, $T_1$ ser el caso de que el primer resultado de la prueba es positivo, y $T_2$ ser el caso de que la segunda prueba es también positivo. Queremos encontrar a $P(D\ |\ T_1,\ T_2)$.

También somos capaces de condición en $T_1$ (es decir, en el caso de que el primer resultado de la prueba es positivo). Esto nos daría:

$$P(D\ |\ T_1,\ T_2) = \frac{P(T_2\ |\ D,\ T_1)P(D\ |\ T_1)}{P(T_2\ |\ T_1)}$$

Desde mis cálculos:

$$P(T_2\ |\ D,\ T_1)\ =\ P(T_2\ |\ D)\ =\ 0.95$$ $$P(D\ |\ T_1)\ \approx\ 0.16$$ $$P(T_2\ |\ T_1)\ =\ \frac{P(T_1 ,\ T_2)}{P(T_1)}\ =\ \frac{P(T_1,\ T_2,\ D)\ +\ P(T_1,\ T_2,\ D^c)}{P(T_1,\ D)\ +\ P(T_1,\ D^c)}\ =\ \frac{0.0115}{0.059}\ \approx\ 0.19$$ $\ $ $$P(D\ |\ T_1,\ T_2)\ =\ \frac{0.95\ \times\ 0.16}{0.19}\ =\ 0.8$$

Por lo tanto, llegué a la conclusión de que hay un 80% de probabilidad de que Fred tiene la enfermedad, dado que tanto la primera y la segunda los resultados de la prueba son positivos.

$\ $

El problema es que el libro de texto ha adoptado un enfoque diferente de la utilización de las probabilidades de la forma de la regla de Bayes, que se tradujo en una conclusión ligeramente diferente de la mía (0.78), y estoy teniendo problemas para entender cómo esa conclusión llegaron a ser.

$\ $

Libro de texto enfoque es el siguiente:

$$\frac{P(D\ |\ T_1,\ T_2)}{P(D^c\ |\ T_1,\ T_2)}\ =\ \frac{P(D)}{P(D^c)}\ \times\ \frac{P(T_1,\ T_2\ |\ D)}{P(T_1,\ T_2\ |\ D^c)}$$

$$=\ \frac{1}{99}\ \times\ \frac{0.95^2}{0.05^2}\ =\ \frac{361}{99}\ \approx\ 3.646$$

que "corresponde a una probabilidad de 0.78."

$\ $

Aquí están las preguntas que tengo:

  1. Es mi enfoque equivocado? Una 0.02 diferencia es una diferencia bastante grande.

  2. ¿Cómo el autor se derivan de la ecuación:

$$P(D\ |\ T_1,\ T_2)\ =\ P(D)P(T_1,\ T_2\ |\ D)$$

  1. ¿Qué hace el autor quiere decir cuando dice "3.646 corresponde a una probabilidad de 0.78?"

$\ $

Cualquier comentario se agradece. Gracias!

4voto

Farrukh Ataev Puntos 21

La probabilidad condicional (o la regla de Bayes) debe ser: $$ P (D \ | \ T_1 \ cap T_2) = \ frac {P (D \ cap T_1 \ cap T_2)} {P (T_1 \ \ color {red} { \ cap} \ T_2)} = \ frac {P (D) \ cdot P (T_1 | D) \ cdot P (T_2 | D \ cap T_1)} {P (T_1 \ \ cap \ T_2)} = \\ \ frac {0.01 \ cdot 0.95 ^ 2} {0.01 \ cdot 0.95 ^ 2 +0.99 \ cdot 0.05 ^ 2} \ approx 0.7848. $$

2voto

David K Puntos 19172

Tengo algunas objeciones con la forma en que el libro de texto constituye su pregunta, comenzando con la suposición de que ambos positivos y negativos de las pruebas de cada uno con la misma probabilidad de ser la correcta, y más aún en el supuesto de que los resultados de dos pruebas en la misma persona son independientes en la probabilidad. En la vida real, me gustaría explorar tanto de los puntos más antes de aconsejar a Fred. Pero vamos a pasar por alto las objeciones por el bien de ser capaz de calcular algo basado en la información dada, y asumir que cada administración de la prueba tiene la misma oportunidad para dar un resultado correcto, incluso cuando los dos exámenes son administrados uno después de otro en la misma persona.

  1. Es mi enfoque equivocado? Una 0.02 diferencia es una diferencia bastante grande.

Los dos métodos son equivalentes. La aparente discrepancia se debe a errores de redondeo.

El libro de texto se encuentra una odds ratio de $361:99,$ que es exacto (en la medida en que el $1\%$ e $95\%$ son exactas). Dado que este es $P(D) : P(D^C),$ la probabilidad está dada por $$ P(D) = \frac{P(D)}{P(D) + P(D^C)} = \frac{361}{361 + 99} \approx 0.78478,$$ que el texto rondas de a $0.78.$ (Ya que se le preguntó acerca de esto como una parte separada de la cuestión, voy a explicar en más detalle a continuación.)

En su enfoque, $P(T_1,\ T_2,\ D)\ +\ P(T_1,\ T_2,\ D^c) = 0.0115$ es un resultado exacto, y así es $P(T_1,\ D)\ +\ P(T_1,\ D^c) = 0.059,$ pero $0.0115 / 0.059 \approx 0.19492.$ Mientras tanto, $P(T_1 \mid D) \approx 0.16102.$ Si seguimos todos estos dígitos en el cálculo, en lugar de redondeo a dos lugares de inmediato, nos encontramos con que $$P(D\mid T_1,\ T_2) = \frac{0.95\times 0.16102}{0.19492} \approx 0.78478.$$ Es decir, mantener a cinco dígitos obtenemos la misma respuesta que el libro de texto (método, si se conservan cinco dígitos), y si redondeamos a dos dígitos sólo al final (como el libro de texto) que, naturalmente, sería ronda de la misma manera, a $0.78.$

Creo que un argumento puede ser hecho para mantener a un solo dígito de precisión en la respuesta (lo preciso es que "$1\%$" de todos modos?), en el que caso de que ambas respuestas ronda a $0.8.$

  1. ¿Cómo el autor se derivan de la ecuación ...

No. En cambio, el hecho es que $$P(D\mid T_1,\ T_2) = \frac{P(T_1,\ T_2\mid D)P(D)}{P(T_1,\ T_2)}$$ y $$P(D^C\mid T_1,\ T_2) = \frac{P(T_1,\ T_2\mid D^C)P(D^C)}{P(T_1,\ T_2)}.$$

Al calcular los coeficientes de las dos probabilidades $$\frac{P(D\mid T_1,\ T_2)}{P(D^C\mid T_1,\ T_2)},$$ usted obtener factores de $P(T_1,\ T_2)$ , tanto en el numerador y el denominador, y estos factores se cancelan uno al otro.

  1. ¿Qué hace el autor quiere decir cuando dice "3.646 corresponde a una probabilidad de 0.78?"

Como mencioné anteriormente, $3.646$ es una odds ratio; o como yo diría más bien, la odds ratio es $3.646 : 1.$ Una odds ratio de $1:1$ corresponde a un $50\%$oportunidad, es decir, cada posibilidad es igualmente probable, mientras que un $2:3$ odds ratio describe algo que ocurre dos veces por cada tres veces que esto no ocurra. en general, si la probabilidad de que algo es $p,$ su odds ratio es $p : (1 - p),$ es, $\frac{p}{1 - p} : 1.$

Si decimos $p = P(D \mid T_1,\ T_2),$luego $P(D^C \mid T_1,\ T_2) = 1 - P(D \mid T_1,\ T_2) = 1 - p,$ y lo que el libro de texto ha calculado es que $$\frac{p}{1 - p} \approx 3.646,$$ que es, en promedio, en situaciones como esta, cuando ambas pruebas dado positivo, no va a ser $3.646$ de los casos en que las pruebas fueron los correctos para cada caso en el que ambas pruebas fueron incorrectas. Eso significa que hay un $3.646$ precisa positivos para cada $3.646 + 1$ los tiempos de la prueba sale positiva en ambas ocasiones, lo que da una probabilidad de $$\frac{3.646}{3.646 + 1} \approx 0.78.$$ La forma en que he trabajado la probabilidad, sin embargo, fue tomar la fracción $$\frac{p}{1 - p} = \frac{361}{99}$$ y directamente extracto de una odds ratio de $361:99$ a partir de ella. Esto significa que puedo esperar hasta el final antes de realizar cualquier tipo de redondeo, pero en otros aspectos es el mismo que el libro de texto del método. En ambos casos, las probabilidades son simplemente $kp : k(1 - p),$ donde $k$ es cualquier constante tiene que multiplicar cada lado con el fin de producir cualquiera de las $361:99$ o $3.646:1$ de la odds ratio $p : (1 - p).$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X