Tengo problemas para entender un cuestionario básico sobre sensibilidad y especificidad y, probablemente, con la comprensión de estos conceptos básicos. El cuestionario dice:
"Supongamos que hemos creado un algoritmo de aprendizaje automático que predice si se hará clic en un enlace con un 99% de sensibilidad y un 99% de especificidad. El porcentaje de clics en el enlace es de 1/1000 de las visitas a un sitio web. Si predecimos que se hará clic en el enlace en una visita específica, ¿cuál es la probabilidad de que realmente se haga clic?"
No puedo entender la solución propuesta porque no entiendo uno de sus pasos. La solución dice:
*"Supongamos que hay 100000 visitas. Esa suposición se basa en 1000 * 100 de la tasa de 1/1000 dada. Lo que se nos pregunta es el valor predictivo positivo (VPP)... "*.
Todavía está bien con eso, pero entonces empieza a escribir código
TP <- 99
FN <- 1
# population=100000 => FP+TN=99000
# specificity=99% => TN=0.99*99000=98901, therefore FP=999
TN <- 0.99 * 99900
FP <- 99900 - TN
PPV <- TP / (TP + FP)
PPV
No entiendo la fila de comentarios
# population=100000 => FP+TN=99000
para mí FP+TN, falsos positivos + verdaderos negativos, es "todos los negativos" y, dado que estamos considerando 100000 visitas y la probabilidad de positivo (clic en el enlace) es de 1 sobre 1000 esperaría que los negativos fueran 100000*0,999 = 99900, no los 99000 informados en la línea de comentarios
¿Cuál es mi(s) error(es)?