He estado aprendiendo la terminología básica sobre cómo pensar en las pruebas binarias que implican pruebas médicas. Los términos básicos están aquí en esta tabla
Esta es la matriz de confusión .
Mi problema es el siguiente. Nota, asumo que $T = N + P$ es el tamaño de la población total. A continuación, la "precisión" de la prueba se define como
$$ACC = \frac{TP+TN}{T}$$
donde tiene esencialmente los casos que diagnosticó correctamente divididos por el total de casos en los que realizó la prueba.
Pero en el caso de muchas enfermedades, la enfermedad no será prevalente, según la definición de
$$PREV = \frac{P}{T}$$
Esto significa que $ACC$ pueden ser muy parciales. Supongamos que nuestro modelo es "supongamos que nadie tiene una enfermedad" y supongamos que el 98% de la población no la tiene, entonces nuestra precisión sería fabulosa porque acertaríamos el 98% de las veces, pero tendríamos una Tasa de Verdaderos Positivos de 0.
¿Existe una medida para la precisión de las pruebas que pondere esencialmente la $TP$ y $TN$ por prevalencia tal que
$$ACC_{2} = \frac{TP\cdot w_{TP} + TN \cdot w_{TN}}{T}$$
donde $w_{TP}$ y $w_{TN}$ ¿están determinadas de algún modo por la prevalencia de la enfermedad?
Quiero algo que, en otras palabras, me dé una estimación de la precisión global que utilice la prevalencia para ponderar la precisión y evitar que la baja prevalencia de una enfermedad dé lugar a una estimación global sesgada de la precisión.