Responderé a esta pregunta tanto desde el punto de vista médico como estadístico. Ha recibido mucha atención en la prensa no especializada, sobre todo después del best-seller La señal y el ruido de Nate Silver, así como una serie de artículos en publicaciones como The New York Times explicando el concepto. Así que me alegro mucho de que @user2666425 haya abierto este tema sobre CV.
En primer lugar, permítanme aclarar que el $p\,(+|C) = 1$ no es preciso. Puedo decir que esta cifra sería un sueño hecho realidad. Desgraciadamente, hay muchos falso negativo mamografías, especialmente en mujeres con tejido mamario denso. La cifra estimada puede ser $20\%$ o superior Dependiendo de si se agrupan los distintos tipos de cáncer de mama en uno solo (invasivo frente a CDIS), y de otros factores. Por ello, también se aplican otras modalidades basadas en la tecnología ecográfica o de resonancia magnética. La diferencia entre $0.8$ y $1$ es fundamental en una prueba de detección.
El teorema de Bayes nos dice que $\small p(C|+) = \large \frac{p(+|C)}{p(+)}\small* p(C)$ y recientemente ha recibido mucha atención en lo que se refiere a la mamografía en mujeres jóvenes de bajo riesgo . Me doy cuenta de que esto no es exactamente lo que pregunta, que abordo en los últimos párrafos, pero es el tema más debatido. He aquí una muestra de las cuestiones:
-
El antes (o probabilidad de tener cáncer según la prevalencia) en más joven pacientes, digamos de 40 a 50 años de edad es más bien pequeño. Según el NCI puede redondearlo en $\sim 1.5\%$ (véase el cuadro siguiente). Esta probabilidad relativamente baja antes de la prueba reduce por sí misma la probabilidad condicional después de la prueba de tener cáncer dado que la mamografía fue positiva, independientemente de la probabilidad o datos recogidos.
-
La probabilidad de un falso positivo se convierte en una cuestión muy importante en un procedimiento de cribado que se aplicará a miles y miles de mujeres a priori sanas. Así, aunque la tasa de falsos positivos de $7 - 10\%$ (que es mucho mayor si se centra en el riesgo acumulado ) puede no sonar tan mal, en realidad es una cuestión de costes psicológicos y económicos colosales, sobre todo teniendo en cuenta la baja probabilidad previa a la prueba en pacientes más jóvenes y de bajo riesgo. Su cifra de $1\%$ está muy lejos de la realidad - la realidad es que los "sustos" son increíblemente comunes debido a muchos factores, incluyendo las preocupaciones médico-legales.
Así que, recalculando y muy importante, para mujeres jóvenes sin factores de riesgo :
$p(C|+) = \frac{p(+|C)}{p(+)}\small* p(C) =$
$= \frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}\small* p(C) = \large \frac{0.8}{0.8*0.015\, +\, 0.07*0.985}\small*\, 0.015 = 0.148$ .
La probabilidad de tener cáncer cuando una mamografía de cribado ha sido leída como positiva puede ser tan baja como $15\%$ en mujeres jóvenes de bajo riesgo. Como apunte, las lecturas mamográficas vienen acompañadas de una estimación indirecta de la confianza en el diagnóstico que tiene el radiólogo (se llama BI-RADS), y este análisis bayesiano cambiaría radicalmente a medida que avanzamos de un BI-RADS 3 a un BI-RADS 5, todas ellas pruebas "positivas" en el sentido más amplio.
Esta cifra, lógicamente, puede modificarse en función de las estimaciones que se consideren en el cálculo, pero lo cierto es que las recomendaciones sobre la edad de inicio para entrar en un programa de mamografía de cribado han recientemente ha sido empujado desde la edad $40$ a $45$ .
En las mujeres mayores, la prevalencia (y, por tanto, la probabilidad previa a la prueba) aumenta linealmente con la edad. Según el informe actual, el riesgo de que a una mujer se le diagnostique un cáncer de mama durante los próximos 10 años a partir de las siguientes edades, es la siguiente:
Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)
Esto da como resultado un riesgo acumulado de por vida de aproximadamente $10\%$ :
El cálculo en las mujeres mayores con una prevalencia de $4\%$ sería:
$p(C|+)=\large \frac{0.8}{0.8*0.04\, +\, 0.07*0.96}\small*\, 0.04 = 0.32 \sim 32\%$ más bajo de lo que has calculado.
No puedo dejar de insistir en la cantidad de "sustos" que hay incluso en las poblaciones de mayor edad. Como procedimiento de cribado, una mamografía es simplemente el primer paso, por lo que tiene sentido que la mamografía positiva se interprete básicamente como existe la posibilidad de que la paciente padezca un cáncer de mama, lo que justifica la realización de más pruebas con ultrasonidos, pruebas mamográficas adicionales (de diagnóstico), mamografías de seguimiento, resonancia magnética o biopsia. Si el $p(C|+)$ era muy alta no estaríamos tratando con un prueba de cribado sería un prueba de diagnóstico como una biopsia.
Respuesta concreta a su pregunta:
Son los "sustos", los $p(+|\bar C)$ de $7-10\%$ y no $1\%$ como en el PO, en combinación con una prevalencia relativamente baja de la enfermedad (baja probabilidad previa a la prueba o alta $p(\bar C)$ ), especialmente en las mujeres más jóvenes, que explica esta menor probabilidad posterior a la prueba en todas las edades. Fíjese en que esta "tasa de falsas alarmas" se multiplica por la proporción mucho mayor de casos sin cáncer (en comparación con los pacientes con cáncer) en el denominador, y no por el "minúsculo 1% de posibilidades de un falso positivo en el 1% de la población" que menciona. Creo que esta es la respuesta a su pregunta. Para enfatizar, aunque esto sería inaceptable en una prueba diagnóstica, sigue valiendo la pena en un procedimiento de cribado.
Cuestión de intuición: @Juho Kokkala sacó a relucir la cuestión de que el OP preguntaba por el intuición . Pensé que estaba implícito en los cálculos y en los párrafos finales, pero es justo... Así es como se lo explicaría a un amigo... Imaginemos que vamos a buscar fragmentos de meteoritos con un detector de metales en Winslow, Arizona. Aquí mismo:
Imagen de meteorcrater.com
...y el detector de metales se dispara. Bueno, si me dijeras que lo más probable es que sea de una moneda que se le cayó a un turista, probablemente tendrías razón. Pero se entiende la idea: si el lugar no hubiera sido revisado tan a fondo, sería mucho más probable que un pitido del detector en un lugar como éste procediera de un fragmento de meteorito que si estuviéramos en las calles de Nueva York.
Lo que estamos haciendo con la mamografía es ir a una población sana, buscando una enfermedad silenciosa que si no se detecta a tiempo puede ser letal. Afortunadamente, la prevalencia (aunque muy alta en comparación con otros cánceres menos curables) es lo suficientemente baja como para que la probabilidad de encontrar un cáncer al azar sea baja, incluso si los resultados son "positivos" y especialmente en las mujeres jóvenes.
Por otro lado, si no hubiera falsos positivos, es decir, ( $p(\bar C|+)=0$ ,
$\frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}\small* p(C) = \frac{p(+|C)}{p(+|C)\,*\,p(C)}\small* p(C) = 1$ , tanto como la probabilidad de haber chocado con un fragmento de meteorito si nuestro detector de metales se dispara sería $100\%$ independiente de la zona que exploramos por casualidad si en lugar de un detector de metales normal, utilizáramos un instrumento perfectamente preciso para detectar aminoácidos del espacio exterior en el fragmento del meteorito (ejemplo inventado). Seguiría siendo más probable encontrar un fragmento en el desierto de Arizona que en la ciudad de Nueva York, pero si el detector emitiera un pitido, sabríamos que habíamos encontrado un meteorito.
Como nunca tenemos un aparato o sistema de medición perfectamente preciso, la fracción $\frac{\text{likelihood}}{\text{unconditional p(+)}}=\frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}$ será $<1$ y cuanto más imperfecta sea, menor será la fracción del $p(C)$ o antes que se "pasará" al LHS de la ecuación como el posterior . Si nos decantamos por un tipo concreto de detector, la fracción de probabilidad actuará como constante en una ecuación lineal de la forma $\text{posterior} = \alpha * \text{prior}$ donde el $\text{posterior} < \text{prior}$ y cuanto más pequeño sea el previo, más pequeño será el posterior. Esto se conoce como la dependencia de prevalencia de la valor predictivo positivo (VPP) Probabilidad de que los sujetos con una prueba de detección positiva tengan realmente la enfermedad.
2 votos
La tasa de falsos positivos no es del 1%, sino del 99% de la población. Por eso se obtiene una probabilidad que puede parecer baja, debido a la altísima probabilidad previa de que alguien esté sano. También hay que tener en cuenta que se trata de una sola prueba, ¿qué pasa si se hace la prueba más de una vez? Entonces la precisión de la prueba empieza a importar más.
0 votos
Si se trata de una mamografía perfecta, la tasa de falsos positivos sería cero, y entonces p(C|M)=1*0,01/(1*0,01 + 0*0,99) = 1,0 A medida que la tasa de falsos positivos de la mamografía se acerca a la perfección (0), el segundo término de la parte inferior se acerca a cero. La "minúscula" tasa de falsos positivos se combina con la igualmente minúscula tasa de base para obtener el resultado contraintuitivo.
0 votos
Por otra parte, mi experiencia sugiere que la lógica, del tipo formal deductivo, es una cosa maravillosa pero genera intuiciones extremadamente malas sobre la inferencia probabilística. Las herramientas aquí bmj.com/content/343/bmj.d6386 puede ayudar a su intuición.
0 votos
A mi entender, la pregunta pide intuición sobre cómo la probabilidad condicional puede ser tan baja dadas las suposiciones; no sobre las estadísticas reales de las mamografías (a las que parecen referirse las respuestas).
0 votos
Creo que hay un error en el denominador (el segundo término debería ser (.01*0.99)? Pero el resultado es correcto. No es realmente una intuición, pero simplificando tienes P(C|+)=P(C) / (P(C) + (P(+|!C)P(!C)) y P(C) es muy baja. Así que P(C|+) es extremadamente sensible a P(+|!C), es decir, necesitarías P(+|!C) << P(C) para conseguir que P(C|+) se acerque a 1