Estoy de acuerdo en que los términos son muy poco intuitivos y difíciles de corresponder con sus fórmulas. Aquí están los trucos mnemotécnicos que he desarrollado.
Nota:
- TP = verdaderos positivos
- TN = verdaderos negativos
- FP = falsos positivos
- FN = falsos negativos
Aquí está la forma abreviada de mis mnemotecnias; los detalles a continuación explican la lógica subyacente, lo que debería ayudar a memorizar lo que significan:
- Precisión : predicciones correctas divididas por todas las predicciones: TP+TN/(TP+FP+FP+FN)
- Precisión y recuperación : centrarse en los verdaderos aspectos positivos
- PRE ción es TP dividido por PRE dicta positivo: TP/(TP+FP)
- RE c A ll es TP dividido por REA l positivo: TP/(TP+FN)
- Sensibilidad y especificidad : centrarse en las predicciones correctas
- SNIP ( S e N sitividad I s P ositivo): TP/(TP+FN)
- SPIN ( SP ecificiencias I s N egativo): TN/(TN+FP)
Los detalles que siguen proporcionan la lógica subyacente para estos, basada en el significado esencial de cada medida.
Precisión: resultados globales
La exactitud es en realidad bastante intuitiva y no suele presentar ninguna dificultad de memorización. Se trata simplemente de las predicciones correctas (verdaderas) divididas entre todas las predicciones, ya sean verdaderas o falsas.
$$ Accuracy = \frac{correct\:predictions}{all\:predictions} = \frac{TP + TN}{TP + TN + FP + FN} $$
Precisión y Recall: centrarse en los verdaderos positivos
La esencia de la precisión y el recuerdo es que ambos consideran la proporción de positivo verdadero es decir, son dos formas diferentes de medir cuántas veces ha acertado el modelo. Por tanto, TP es siempre el numerador. La diferencia entre ellos está en el denominador: mientras que la precisión considera todos los valores que se predijeron como positivos (ya sea correctamente o no), el recuerdo considera todos los valores que realmente son positivos (ya sea correctamente predicho o no).
La precisión es la proporción de predicciones positivas que fueron correctas: $$ Precision = \frac{true\:positive}{\pmb P\pmb R\pmb E dicted\:positive} = \frac{TP}{TP + FP} $$
La recuperación es la proporción de positivos reales o reales que se predijeron correctamente: $$ Recall = \frac{true\:positive}{\pmb R\pmb E\pmb A l\:positive} = \frac{TP}{TP + FN} $$
Para diferenciarlos, puedes recordar:
- PRE ción es TP dividido por PRE dicta positivo
- RE c A ll es TP dividido por REA l positivo
Sensibilidad y especificidad: centrarse en las predicciones correctas
La esencia de la sensibilidad y la especificidad es que ambas se centran en la proporción de predicciones correctas . Así, el numerador es siempre una medida de las predicciones verdaderas y el denominador es siempre todo el total de predicciones correspondientes de esa clase. Mientras que la sensibilidad mide la proporción de predicciones positivas correctas de todos los valores positivos reales, la especificidad mide la proporción de predicciones negativas correctas de todos los valores negativos reales.
La sensibilidad es la proporción de positivos reales que se predijeron correctamente: $$ Sensitivity = \frac{true\:\pmb Positive}{real\:\pmb Positive} = \frac{TP}{TP + FN} $$ (Obsérvese que, aunque las fórmulas de Recall y Sensitivity son matemáticamente idénticas, cuando el recall se empareja con la precisión y la sensibilidad con la especificidad, las interpretaciones y aplicaciones de las dos medidas son bastante diferentes).
La especificidad es la proporción de negativos reales que se predijeron correctamente: $$ Specificity = \frac{true\:\pmb Negative}{real\:\pmb Negative} = \frac{TN}{TN + FP} $$
Para recordar cuál es cuál, recuerda "recortar y girar", pero ten en cuenta que las letras P y N se intercambian (es decir, giran y se recortan los extremos de los nombres largos):
- SNIP ( S e N sitividad I s P ositivo)
- SPIN ( SP ecificiencias I s N egativo)
5 votos
La mejor manera de recordarlo es recordando un estudio de la vida real en el que tal o cual característica estaba en el punto de mira. Es decir, la carne contextual ayuda.
4 votos
Para mí, la mejor manera de recordar estos conceptos es a través de la tabla de contingencia 2×2 dentro del Enlace a Wikipedia .
2 votos
@ttnphns: ¡"carne contextual" es una gran errata!
5 votos
La recuperación es la sensibilidad, ahí tienes una menos con la que lidiar. :)
1 votos
Sólo para mantenerlo aquí, este post ofrece una buena explicación: uberpython.wordpress.com/2012/01/01/
0 votos
Vengo del futuro (que pronto será el pasado). No creo que esta pregunta se refiera tanto a aprender las definiciones como a recordarlas.