28 votos

¿Ha publicado Statistics.com la respuesta equivocada?

Statistics.com publicó un problema de la semana: La tasa de fraude en los seguros de vivienda es del 10% (uno de cada diez siniestros es fraudulento). Un consultor ha propuesto un sistema de aprendizaje automático para revisar las reclamaciones y clasificarlas como fraudulentas o no fraudulentas. El sistema tiene una eficacia del 90% en la detección de los siniestros fraudulentos, pero sólo del 80% en la clasificación correcta de los siniestros no fraudulentos (etiqueta erróneamente uno de cada cinco como "fraude"). Si el sistema clasifica una reclamación como fraudulenta, ¿cuál es la probabilidad de que sea realmente fraudulenta?

https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true

Mi compañero y yo llegamos a la misma respuesta de forma independiente y no coincide con la solución publicada.

Nuestra solución:

(.9*.1)/((.9*.1)+(.2*.9))=1/3

Su solución:

Este es un problema de probabilidad condicional. (También es un problema bayesiano, pero la aplicación de la fórmula de la regla de Bayes sólo ayuda a oscurecer lo que está pasando). Consideremos 100 reclamaciones. 10 serán fraudulentas, y el sistema etiquetará correctamente 9 de ellas como "fraude". 90 reclamaciones estarán bien, pero el sistema clasificará incorrectamente 72 (80%) como "fraude". Así que un total de 81 reclamaciones han sido etiquetadas como fraudulentas, pero sólo 9 de ellas, el 11%, son realmente fraudulentas.

Quién tenía razón

41voto

James Otto Puntos 23

Creo que usted y su colega tienen razón. Statistics.com tiene la línea de pensamiento correcta, pero comete un simple error. De las 90 reclamaciones "OK", esperamos que el 20% de ellas sean clasificadas incorrectamente como fraude, no el 80%. El 20% de 90 es 18, lo que lleva a 9 reclamaciones correctamente identificadas y 18 incorrectas, con una proporción de 1/3, exactamente lo que arroja la regla de Bayes.

12voto

Dilip Sarwate Puntos 16161

Tienes razón. La solución que el sitio web publicó se basa en una lectura errónea del problema, ya que el 80% de las reclamaciones no fraudulentas se clasifican como fraudulentas en lugar del 20% dado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X