He estado aprendiendo la terminología básica sobre cómo pensar en las pruebas binarias que implican pruebas médicas. Los términos básicos están aquí en esta tabla
Esta es la matriz de confusión .
Mi problema es el siguiente. Nota, asumo que es el tamaño de la población total. A continuación, la "precisión" de la prueba se define como
donde tiene esencialmente los casos que diagnosticó correctamente divididos por el total de casos en los que realizó la prueba.
Pero en el caso de muchas enfermedades, la enfermedad no será prevalente, según la definición de
Esto significa que pueden ser muy parciales. Supongamos que nuestro modelo es "supongamos que nadie tiene una enfermedad" y supongamos que el 98% de la población no la tiene, entonces nuestra precisión sería fabulosa porque acertaríamos el 98% de las veces, pero tendríamos una Tasa de Verdaderos Positivos de 0.
¿Existe una medida para la precisión de las pruebas que pondere esencialmente la y por prevalencia tal que
donde y ¿están determinadas de algún modo por la prevalencia de la enfermedad?
Quiero algo que, en otras palabras, me dé una estimación de la precisión global que utilice la prevalencia para ponderar la precisión y evitar que la baja prevalencia de una enfermedad dé lugar a una estimación global sesgada de la precisión.