Estoy tratando de entender cómo calcular el punto de corte óptimo para una curva ROC (el valor en el que la sensibilidad y la especificidad se maximizan). Estoy utilizando el conjunto de datos aSAH
del paquete pROC
.
El outcome
variable podría ser explicada por dos variables independientes: s100b
y ndka
. Utilizando la sintaxis del Epi
he creado dos modelos:
library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)
El resultado se ilustra en los dos gráficos siguientes:
En el primer gráfico ( s100b
), la función dice que el punto de corte óptimo se localiza en el valor correspondiente a lr.eta=0.304
. En el segundo gráfico ( ndka
) el punto de corte óptimo se localiza en el valor correspondiente a lr.eta=0.335
(¿Qué significa lr.eta
). Mi primera pregunta es:
- cuál es el correspondiente
s100b
yndka
valores para ellr.eta
valores indicados (cuál es el punto de corte óptimo en términos des100b
yndka
)?
SEGUNDA PREGUNTA:
Ahora supongamos que creo un modelo teniendo en cuenta ambas variables:
ROC(form=outcome~ndka+s100b, data=aSAH)
El gráfico obtenido es:
Quiero saber cuáles son los valores de ndka
Y s100b
en la que la sensibilidad y la especificidad son maximizadas por la función. En otros términos: ¿cuáles son los valores de ndka
y s100b
en la que tenemos Se=68,3% y Sp=76,4% (valores derivados del gráfico)?
Supongo que esta segunda pregunta está relacionada con el análisis multiROC, pero la documentación del Epi
no explica cómo calcular el punto de corte óptimo para ambos variables utilizadas en el modelo.
Mi pregunta es muy similar a esta pregunta de reasearchGate que dice en pocas palabras:
La determinación de la puntuación de corte que representa un mejor equilibrio entre la sensibilidad y la especificidad de una medida es sencilla. Sin embargo, para el análisis de la curva ROC multivariante, he observado que la mayoría de los investigadores se han centrado en algoritmos para determinar la de una combinación lineal de varios indicadores (variables) en en términos de AUC. [...]
Sin embargo, estos métodos no mencionan cómo decidir una combinación de de puntuaciones de corte asociadas a los múltiples indicadores que proporciona la mejor precisión diagnóstica.
Una posible solución es la que propone Shultz en su papel pero a partir de este artículo no soy capaz de entender cómo calcular el punto de corte óptimo para una curva ROC multivariante.
Tal vez la solución del Epi
no es lo ideal, por lo que se agradecerá cualquier otro enlace útil.