9 votos

¿Por qué los conocedores del Teorema de Bayes siguen cometiendo la Falacia de la Tasa Base?

Origen: 6 de julio de 2014, "¿Los médicos entienden los resultados de las pruebas?" por William Kremer, BBC World Service.

Una mujer de 50 años, sin síntomas previos de cáncer de mama, participa en un tamizaje mamográfico rutinario. Da positivo en la prueba, se alarma y quiere saber del médico si tiene cáncer de mama o cuáles son las posibilidades. Aparte de los resultados de la prueba, el médico no sabe nada más sobre esta mujer. ¿Cuántas mujeres que dan positivo tienen realmente cáncer de mama?

a. nueve de cada 10 b. ocho de cada 10 c. uno de cada 10 d. uno de cada 100

Información adicional (necesaria): La probabilidad de que una mujer tenga cáncer de mama es del 1% ("prevalencia" o probabilidad de base). Si una mujer tiene cáncer de mama, la probabilidad de que dé positivo en la prueba es del 90% ("sensibilidad" o índice de fiabilidad). Si una mujer no tiene cáncer de mama, la probabilidad de que, de todas formas, dé positivo en la prueba es del 9% ("índice de falsa alarma" o tasa de falsos positivos).

He utilizado un ejemplo similar al enseñar probabilidad y estadísticas introductorias durante aproximadamente 30 años, y siento que la mayoría de los instructores utilizan alguna variación de este problema (si no es por otra razón) como ejemplo del Teorema de Bayes.

Lo que me asombra es que solo el 21% de los ginecólogos respondió (según lo reportado por el autor) con la respuesta correcta (por favor, dejemos la solución de este problema para un estudiante).

Mis preguntas más cósmicas: 1. ¿Por qué nuestros estudiantes no entienden esta aplicación básica del Teorema de Bayes? 2. ¿Qué podemos hacer como instructores para explicar este concepto de probabilidad previa y posterior de manera más clara? 3. ¿Por qué los expertos entrenados (ginecólogos) responden mal a esta pregunta?

0 votos

¿No es la explicación típica que la gente presta muy poca atención a la probabilidad previa? La prevalencia es muy baja; la mayoría de las personas sobreestiman.

0 votos

Los médicos y abogados (y también estudiantes de medicina y derecho) son particularmente malos en estadísticas, porque están entrenados para inferir resultados rápidamente a partir de información limitada y luego tratar de persuadir a las personas de que son correctos, incluso si no lo son. Por lo tanto, a menudo se saltan el paso de "¿tiene sentido esto?".

4voto

paw88789 Puntos 19712

Como instructor ocasional de probabilidad, voy a intentarlo.

Respuesta a (1): Creo que es poco intuitivo. Los estudiantes pueden estar apurados por aprender una fórmula para resolver correctamente un problema de tarea o examen. Su objetivo puede no ser realmente entender. También hay una serie de conceptos en el mundo que se aprenden para la clase y luego se olvidan (esto se ha estudiado mucho en física, donde incluso algo tan básico como la fuerza de la gravedad actuando sobre una pelota no se entiende bien). Luego, más tarde, en el momento de la verdad, es mucho más fácil pensar que la prueba (para el cáncer) es 90% precisa, y por lo tanto, una prueba positiva implica un 90% de probabilidad de cáncer.

Respuesta a (2): Una sugerencia, y esto también se menciona en el artículo que mencionas, es usar números reales. En la situación anterior, digamos que hay una población de 100,000 mujeres. De estas, el 1$\%$, o 1000 tienen cáncer de mama. De estas, el 90$\%$ o 900 darán positivo en la prueba. De las 99,000 mujeres restantes (libres de cáncer), el 9$\%$, o 8910 darán (falsamente) positivo. Sabemos que obtuvimos un resultado positivo en la prueba, por lo que proviene de un grupo de 9810 pruebas positivas. Pero solo 900 de estas son el resultado de personas que tienen cáncer. Por lo tanto, la probabilidad de tener cáncer sigue siendo solo $\frac{900}{9810}$.

Se espera que al ver los números reales sea más convincente y proporcione una mejor comprensión de lo que sucede con el Teorema de Bayes.

3voto

Mr.Spot Puntos 2554

Creo que el problema radica en la forma en que normalmente resolvemos el problema. Los estudiantes siguen un procedimiento para obtener una respuesta (como la solución de árbol mostrada en el artículo) pero no se aprende nada sobre la estructura del problema. Sea $D$ el evento "tiene la enfermedad" y el complemento de D sea $D^c.$ Y "+" representa "la prueba da una respuesta positiva". Entonces podemos escribir la Regla de Bayes como $$\frac{P(D|+)}{P(D^c|+)}=\frac{P(+|D)}{P(+|D^c)} \frac{P(D)}{P(D^c)} $$

$$\frac{P(D|+)}{1-P(D|+)}= \frac{\text{Sensibilidad}}{\text{Falso Positivo}}\frac{P(D)}{1-P(D)} $$

De izquierda a derecha, esto es: las probabilidades a posteriori son iguales al cociente de verosimilitud multiplicado por el cociente de probabilidades a priori. El término $P(D)/[1-P(D)]$ es el cociente de probabilidades a priori de tener la enfermedad o 1/99 en este ejemplo. Nota que estas son "probabilidades de un evento", en este caso tener la enfermedad. Las probabilidades en el contexto de Las Vegas son "probabilidades en contra". Creo que las probabilidades de un evento son un poco más fáciles de entender ya que las probabilidades y las probabilidades están relacionadas de manera monótona. El cociente de verosimilitud no es un cociente de probabilidades como los otros dos términos. Es decir, los dos primeros y terceros cocientes son de la forma $p/(1-p)$ y son solo una forma diferente de expresar probabilidades. El término del medio se puede pensar como un factor de amplificación que convierte las probabilidades a priori en probabilidades a posteriori. Si es igual a $1$, un resultado positivo de la prueba no nos proporciona información adicional. Esperaríamos un número grande para este cociente. En este ejemplo tenemos un cociente de 10. Entonces esto convierte nuestras probabilidades a priori de 1/99 en probabilidades a posteriori de 10/99. Para convertir las probabilidades a posteriori en probabilidad, utilice: $\dfrac{\text{probabilidades a posteriori}}{1+ \text{probabilidades a posteriori}}$. Entonces obtenemos $P(D|+)=10/109.$ Vemos que un resultado positivo de la prueba aumenta la probabilidad de la enfermedad de $0.01$ a $0.092$.

Claramente vemos que si la prueba tuviera una mayor Sensibilidad o una menor tasa de Falsos Positivos, el cociente de probabilidad aumentaría y terminaríamos con probabilidades a posteriori más altas.

La otra cantidad de interés es $P(D|-),$ es decir, la posibilidad de que tengas la enfermedad aunque obtuviste un resultado negativo en la prueba. (Recuerda: los resultados negativos son buenos y los positivos son malos en la detección de enfermedades.)

$$\frac{P(D|-)}{1-P(D|-)}= \frac{1-\text{Sensibilidad}}{1-\text{Falso Positivo}}\frac{P(D)}{1-P(D)} $$

Esto comienza en $1/99$ como en el ejemplo anterior y tiene un cociente de verosimilitud de $1/9.$ Las probabilidades a posteriori de $1/891$ se convierten en $P(D|-)=1/892.$ Así que puedes estar tranquilo si obtienes un resultado negativo. El resultado de la prueba ha reducido tu probabilidad de enfermedad de $0.01$ a $1/892.$ Nota que aquí estamos comenzando con las mismas probabilidades de enfermedad $P(D)/[1-P(D)]$ pero dado que ahora estamos viendo un resultado "-", una prueba informativa reducirá esas probabilidades que es lo que hace el cociente de $1/9$. Si prefieres cocientes de verosimilitud que sean mayores que 1 para una buena prueba, simplemente recíproca cada factor.

Creo que este enfoque es deseable ya que separa claramente la información previa de la información obtenida de la prueba. Y muestra la Regla de Bayes como un factor que modifica las probabilidades a priori según la efectividad de la prueba.

Aunque esto pueda parecer un enfoque que solo usaría un estadístico Bayesiano, no requiere un punto de vista estadístico Bayesiano.

0voto

LePressentiment Puntos 2053

Creo que las personas están fallando en distinguir los Falsos Positivos, Falsos Negativos, Sensibilidad y Especificidad. Esta imagen de Wikipedia puede ayudar:

introducir descripción de la imagen aquí

Además, deberían desambiguar el significado de "exactitud" de manera más precisa.

0voto

Brian Drake Puntos 180

Mi suposición es, expresada usando algunos símbolos: La gente confunde $P(A|B)$ con $P(B|A)$.

Esta suposición se basa en la respuesta de paw88789, y la siguiente cita del artículo vinculado en la pregunta:

En una sesión, casi la mitad del grupo de 160 ginecólogos respondió que la probabilidad de que la mujer tuviera cáncer era de nueve de cada diez.

Creo que, en general, saber cuál respuesta incorrecta dieron las personas es muy útil para intentar comprender por qué dieron esa respuesta incorrecta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X