Statistics.com publicó un problema de la semana: La tasa de fraude en los seguros de vivienda es del 10% (uno de cada diez siniestros es fraudulento). Un consultor ha propuesto un sistema de aprendizaje automático para revisar las reclamaciones y clasificarlas como fraudulentas o no fraudulentas. El sistema tiene una eficacia del 90% en la detección de los siniestros fraudulentos, pero sólo del 80% en la clasificación correcta de los siniestros no fraudulentos (etiqueta erróneamente uno de cada cinco como "fraude"). Si el sistema clasifica una reclamación como fraudulenta, ¿cuál es la probabilidad de que sea realmente fraudulenta?
https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true
Mi compañero y yo llegamos a la misma respuesta de forma independiente y no coincide con la solución publicada.
Nuestra solución:
(.9*.1)/((.9*.1)+(.2*.9))=1/3
Su solución:
Este es un problema de probabilidad condicional. (También es un problema bayesiano, pero la aplicación de la fórmula de la regla de Bayes sólo ayuda a oscurecer lo que está pasando). Consideremos 100 reclamaciones. 10 serán fraudulentas, y el sistema etiquetará correctamente 9 de ellas como "fraude". 90 reclamaciones estarán bien, pero el sistema clasificará incorrectamente 72 (80%) como "fraude". Así que un total de 81 reclamaciones han sido etiquetadas como fraudulentas, pero sólo 9 de ellas, el 11%, son realmente fraudulentas.
Quién tenía razón