11 votos

Interpretación del Teorema de Bayes aplicado a los resultados positivos de las mamografías

Estoy tratando de entender el resultado del Teorema de Bayes aplicado al clásico ejemplo de la mamografía, con el matiz de que la mamografía es perfecta.

Eso es,

Incidencia del cáncer: $.01$

Probabilidad de una mamografía positiva, dado que la paciente tiene cáncer: $1$

Probabilidad de una mamografía positiva, dado que la paciente no tiene cáncer: $.01$

Por Bayes:

P(cáncer | mamografía+) = $\dfrac {1 \cdot .01}{(1 \cdot .01) + (.091 \cdot .99)}$

$ = .5025$

Entonces, si una persona al azar de la población se hace la mamografía y obtiene un resultado positivo, ¿hay un 50% de posibilidades de que tenga cáncer? No consigo entender intuitivamente cómo el minúsculo 1% de posibilidades de un falso positivo en el 1% de la población puede desencadenar un resultado del 50%. Lógicamente, pensaría que una mamografía con un resultado positivo perfectamente verdadero y con una tasa de falsos positivos ínfima sería mucho más precisa.

2 votos

La tasa de falsos positivos no es del 1%, sino del 99% de la población. Por eso se obtiene una probabilidad que puede parecer baja, debido a la altísima probabilidad previa de que alguien esté sano. También hay que tener en cuenta que se trata de una sola prueba, ¿qué pasa si se hace la prueba más de una vez? Entonces la precisión de la prueba empieza a importar más.

0 votos

Si se trata de una mamografía perfecta, la tasa de falsos positivos sería cero, y entonces p(C|M)=1*0,01/(1*0,01 + 0*0,99) = 1,0 A medida que la tasa de falsos positivos de la mamografía se acerca a la perfección (0), el segundo término de la parte inferior se acerca a cero. La "minúscula" tasa de falsos positivos se combina con la igualmente minúscula tasa de base para obtener el resultado contraintuitivo.

0 votos

Por otra parte, mi experiencia sugiere que la lógica, del tipo formal deductivo, es una cosa maravillosa pero genera intuiciones extremadamente malas sobre la inferencia probabilística. Las herramientas aquí bmj.com/content/343/bmj.d6386 puede ayudar a su intuición.

13voto

Antoni Parellada Puntos 2762

Responderé a esta pregunta tanto desde el punto de vista médico como estadístico. Ha recibido mucha atención en la prensa no especializada, sobre todo después del best-seller La señal y el ruido de Nate Silver, así como una serie de artículos en publicaciones como The New York Times explicando el concepto. Así que me alegro mucho de que @user2666425 haya abierto este tema sobre CV.

En primer lugar, permítanme aclarar que el $p\,(+|C) = 1$ no es preciso. Puedo decir que esta cifra sería un sueño hecho realidad. Desgraciadamente, hay muchos falso negativo mamografías, especialmente en mujeres con tejido mamario denso. La cifra estimada puede ser $20\%$ o superior Dependiendo de si se agrupan los distintos tipos de cáncer de mama en uno solo (invasivo frente a CDIS), y de otros factores. Por ello, también se aplican otras modalidades basadas en la tecnología ecográfica o de resonancia magnética. La diferencia entre $0.8$ y $1$ es fundamental en una prueba de detección.

El teorema de Bayes nos dice que $\small p(C|+) = \large \frac{p(+|C)}{p(+)}\small* p(C)$ y recientemente ha recibido mucha atención en lo que se refiere a la mamografía en mujeres jóvenes de bajo riesgo . Me doy cuenta de que esto no es exactamente lo que pregunta, que abordo en los últimos párrafos, pero es el tema más debatido. He aquí una muestra de las cuestiones:

  1. El antes (o probabilidad de tener cáncer según la prevalencia) en más joven pacientes, digamos de 40 a 50 años de edad es más bien pequeño. Según el NCI puede redondearlo en $\sim 1.5\%$ (véase el cuadro siguiente). Esta probabilidad relativamente baja antes de la prueba reduce por sí misma la probabilidad condicional después de la prueba de tener cáncer dado que la mamografía fue positiva, independientemente de la probabilidad o datos recogidos.

  2. La probabilidad de un falso positivo se convierte en una cuestión muy importante en un procedimiento de cribado que se aplicará a miles y miles de mujeres a priori sanas. Así, aunque la tasa de falsos positivos de $7 - 10\%$ (que es mucho mayor si se centra en el riesgo acumulado ) puede no sonar tan mal, en realidad es una cuestión de costes psicológicos y económicos colosales, sobre todo teniendo en cuenta la baja probabilidad previa a la prueba en pacientes más jóvenes y de bajo riesgo. Su cifra de $1\%$ está muy lejos de la realidad - la realidad es que los "sustos" son increíblemente comunes debido a muchos factores, incluyendo las preocupaciones médico-legales.

Así que, recalculando y muy importante, para mujeres jóvenes sin factores de riesgo :

$p(C|+) = \frac{p(+|C)}{p(+)}\small* p(C) =$

$= \frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}\small* p(C) = \large \frac{0.8}{0.8*0.015\, +\, 0.07*0.985}\small*\, 0.015 = 0.148$ .

La probabilidad de tener cáncer cuando una mamografía de cribado ha sido leída como positiva puede ser tan baja como $15\%$ en mujeres jóvenes de bajo riesgo. Como apunte, las lecturas mamográficas vienen acompañadas de una estimación indirecta de la confianza en el diagnóstico que tiene el radiólogo (se llama BI-RADS), y este análisis bayesiano cambiaría radicalmente a medida que avanzamos de un BI-RADS 3 a un BI-RADS 5, todas ellas pruebas "positivas" en el sentido más amplio.

Esta cifra, lógicamente, puede modificarse en función de las estimaciones que se consideren en el cálculo, pero lo cierto es que las recomendaciones sobre la edad de inicio para entrar en un programa de mamografía de cribado han recientemente ha sido empujado desde la edad $40$ a $45$ .

En las mujeres mayores, la prevalencia (y, por tanto, la probabilidad previa a la prueba) aumenta linealmente con la edad. Según el informe actual, el riesgo de que a una mujer se le diagnostique un cáncer de mama durante los próximos 10 años a partir de las siguientes edades, es la siguiente:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

Esto da como resultado un riesgo acumulado de por vida de aproximadamente $10\%$ :

El cálculo en las mujeres mayores con una prevalencia de $4\%$ sería:

$p(C|+)=\large \frac{0.8}{0.8*0.04\, +\, 0.07*0.96}\small*\, 0.04 = 0.32 \sim 32\%$ más bajo de lo que has calculado.

No puedo dejar de insistir en la cantidad de "sustos" que hay incluso en las poblaciones de mayor edad. Como procedimiento de cribado, una mamografía es simplemente el primer paso, por lo que tiene sentido que la mamografía positiva se interprete básicamente como existe la posibilidad de que la paciente padezca un cáncer de mama, lo que justifica la realización de más pruebas con ultrasonidos, pruebas mamográficas adicionales (de diagnóstico), mamografías de seguimiento, resonancia magnética o biopsia. Si el $p(C|+)$ era muy alta no estaríamos tratando con un prueba de cribado sería un prueba de diagnóstico como una biopsia.

Respuesta concreta a su pregunta:

Son los "sustos", los $p(+|\bar C)$ de $7-10\%$ y no $1\%$ como en el PO, en combinación con una prevalencia relativamente baja de la enfermedad (baja probabilidad previa a la prueba o alta $p(\bar C)$ ), especialmente en las mujeres más jóvenes, que explica esta menor probabilidad posterior a la prueba en todas las edades. Fíjese en que esta "tasa de falsas alarmas" se multiplica por la proporción mucho mayor de casos sin cáncer (en comparación con los pacientes con cáncer) en el denominador, y no por el "minúsculo 1% de posibilidades de un falso positivo en el 1% de la población" que menciona. Creo que esta es la respuesta a su pregunta. Para enfatizar, aunque esto sería inaceptable en una prueba diagnóstica, sigue valiendo la pena en un procedimiento de cribado.

Cuestión de intuición: @Juho Kokkala sacó a relucir la cuestión de que el OP preguntaba por el intuición . Pensé que estaba implícito en los cálculos y en los párrafos finales, pero es justo... Así es como se lo explicaría a un amigo... Imaginemos que vamos a buscar fragmentos de meteoritos con un detector de metales en Winslow, Arizona. Aquí mismo:

Imagen de meteorcrater.com

...y el detector de metales se dispara. Bueno, si me dijeras que lo más probable es que sea de una moneda que se le cayó a un turista, probablemente tendrías razón. Pero se entiende la idea: si el lugar no hubiera sido revisado tan a fondo, sería mucho más probable que un pitido del detector en un lugar como éste procediera de un fragmento de meteorito que si estuviéramos en las calles de Nueva York.

Lo que estamos haciendo con la mamografía es ir a una población sana, buscando una enfermedad silenciosa que si no se detecta a tiempo puede ser letal. Afortunadamente, la prevalencia (aunque muy alta en comparación con otros cánceres menos curables) es lo suficientemente baja como para que la probabilidad de encontrar un cáncer al azar sea baja, incluso si los resultados son "positivos" y especialmente en las mujeres jóvenes.

Por otro lado, si no hubiera falsos positivos, es decir, ( $p(\bar C|+)=0$ ,

$\frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}\small* p(C) = \frac{p(+|C)}{p(+|C)\,*\,p(C)}\small* p(C) = 1$ , tanto como la probabilidad de haber chocado con un fragmento de meteorito si nuestro detector de metales se dispara sería $100\%$ independiente de la zona que exploramos por casualidad si en lugar de un detector de metales normal, utilizáramos un instrumento perfectamente preciso para detectar aminoácidos del espacio exterior en el fragmento del meteorito (ejemplo inventado). Seguiría siendo más probable encontrar un fragmento en el desierto de Arizona que en la ciudad de Nueva York, pero si el detector emitiera un pitido, sabríamos que habíamos encontrado un meteorito.

Como nunca tenemos un aparato o sistema de medición perfectamente preciso, la fracción $\frac{\text{likelihood}}{\text{unconditional p(+)}}=\frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}$ será $<1$ y cuanto más imperfecta sea, menor será la fracción del $p(C)$ o antes que se "pasará" al LHS de la ecuación como el posterior . Si nos decantamos por un tipo concreto de detector, la fracción de probabilidad actuará como constante en una ecuación lineal de la forma $\text{posterior} = \alpha * \text{prior}$ donde el $\text{posterior} < \text{prior}$ y cuanto más pequeño sea el previo, más pequeño será el posterior. Esto se conoce como la dependencia de prevalencia de la valor predictivo positivo (VPP) Probabilidad de que los sujetos con una prueba de detección positiva tengan realmente la enfermedad.

5voto

dan90266 Puntos 609

Un problema clave de la mamografía que no se ha abordado adecuadamente en el discurso es la defectuosa definición de "positivo". Esto se describe en el Diagnóstico capítulo en http://biostat.mc.vanderbilt.edu/ClinStat - ver el enlace para Bioestadística en la investigación biomédica allí.

Uno de los sistemas de codificación diagnóstica más utilizados en mamografía es la puntuación BI-RADS, y una puntuación de 4 es un resultado "positivo" frecuente. La definición de la categoría 4 es "No es característico de un cáncer de mama, pero tiene una probabilidad razonable de ser maligno (entre el 3 y el 94%); debe considerarse la posibilidad de realizar una biopsia". Con un rango de riesgo que va de 0,03 a 0,94 para una categoría Es decir, la increíble heterogeneidad de lo que significa realmente "positivo", no es de extrañar que tengamos un lío entre manos.

También es un signo de pensamiento poco claro que el sistema BI-RADS no tenga una categoría para alguien con un riesgo estimado de 0,945.

Como Nate Silver argumenta tan elocuentemente en La señal y el ruido Si pensáramos de forma probabilística, tomaríamos mejores decisiones en general. La eliminación de términos como "positivo" y "negativo" para las pruebas médicas eliminaría los falsos positivos y los falsos negativos y transmitiría la incertidumbre (y la justificación para realizar más pruebas antes de hacer un diagnóstico) de forma óptima.

0 votos

Estábamos escribiendo en sincronía práctica - comprueba mis comentarios más abajo sobre BI-RADS. No podría estar más de acuerdo (toneladas de experiencia personal en esto como un radiólogo).

4voto

Jimit Puntos 188

En el libro hay un buen debate al respecto Riesgos calculados

Gran parte del libro trata de encontrar formas más claras de hablar y pensar sobre la probabilidad y el riesgo. Un ejemplo:

La probabilidad de que una mujer de 40 años tenga cáncer de mama es de aproximadamente el 1%. Si tiene cáncer de mama, la probabilidad de que dé positivo en una mamografía de cribado es de aproximadamente el 90%. Si no tiene cáncer de mama, la probabilidad de que dé un resultado positivo es del 9 por ciento. ¿Cuáles son las probabilidades de que una mujer que da positivo tenga realmente cáncer de mama?

Esta es la forma en que el libro presenta la solución, utilizando "frecuencias naturales". Consideremos 10.000 mujeres, el 1% tiene cáncer, es decir, 100 mujeres. De ellas, el 90% dará positivo en las pruebas (es decir, 90 mujeres con cáncer darán positivo). De las 9900 que no tienen cáncer, el 9% dará un resultado positivo, es decir, 891 mujeres. Por tanto, hay 891 + 90 = 981 mujeres con pruebas positivas, de las cuales 90 tienen cáncer. Por tanto, la probabilidad de que una mujer con una prueba positiva tenga cáncer es de 90/981 = 0,092

Si el 100% de las mujeres con cáncer dan positivo en las pruebas, los números cambian un poco a 100/(100 + 891) = 0,1

Natural frequency approach to understanding false positives

1voto

Rahul Bhadana Puntos 607

Tal vez esta línea de pensamiento sea correcta..:

Para cualquier persona al azar, hay un 1% de probabilidades de que tenga cáncer, y entonces hay un $.01 * 1$ probabilidad de que la mamografía de una persona al azar sea positiva. Si no tienen cáncer, hay un 1% de posibilidades de que la mamografía sea positiva.

Por lo tanto, es intuitivamente cercano a un lanzamiento de moneda para una persona al azar. No estoy seguro de cómo explicar el $0.0025$ a favor del cáncer ante una mamografía positiva.

1voto

Andrew Puntos 629

Esta es una forma demasiado simplificada pero intuitiva de verlo. Piensa en 100 personas. Una de ellas tiene cáncer y dará positivo en la prueba. De las 99 que no lo tienen, una de ellas obtendrá un falso positivo. Así que de los dos positivos, uno tendrá cáncer y otro no.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X