Esta pregunta se refiere a la estimación de las puntuaciones de corte en un cuestionario de cribado multidimensional para predecir un punto final binario, en presencia de escalas correlacionadas.
Me preguntaron sobre el interés de controlar las subpuntuaciones asociadas al idear puntuaciones de corte en cada dimensión de una escala de medición (rasgos de personalidad) que podría utilizarse para el cribado del alcoholismo. Es decir, en este caso concreto, la persona no estaba interesada en ajustar sobre covariables externas (predictores) -lo que conduce a un área (parcial) bajo la curva ROC ajustada por covariables, por ejemplo (1-2)- sino esencialmente sobre otras puntuaciones del mismo cuestionario porque se correlacionan unas con otras (por ejemplo, "impulsividad" con "búsqueda de sensaciones"). Se trata de construir un MLG que incluya en el lado izquierdo la puntuación de interés (para la que buscamos un punto de corte) y otra puntuación calculada a partir del mismo cuestionario, mientras que en el lado derecho el resultado puede ser el estado de consumo de alcohol.
Para aclarar (por petición de @robin), supongamos que tenemos $j=4$ resultados, digamos $x_j$ (por ejemplo, ansiedad, impulsividad, neuroticismo, búsqueda de sensaciones), y queremos encontrar un valor de corte $t_j$ (es decir, "caso positivo" si $x_j>t_j$ y "caso negativo" en caso contrario) para cada uno de ellos. Normalmente ajustamos otros factores de riesgo, como el sexo o la edad, a la hora de establecer ese punto de corte (mediante el análisis de la curva ROC). Ahora bien, ¿qué pasa si ajustamos la impulsividad (IMP) en función del sexo, la edad y la búsqueda de sensaciones (SS), ya que se sabe que la SS está correlacionada con la IMP? En otras palabras, tendríamos un valor de corte para la IMP en el que se eliminaría el efecto de la edad, el sexo y el nivel de ansiedad.
Aparte de decir que un corte debe ser lo más sencillo posible, mi respuesta fue
En cuanto a las covariables, recomendaría estimar las AUC con y sin ajuste, sólo para ver si el rendimiento predictivo aumenta. Aquí, sus covariables son simplemente otras subpuntos definidos a partir del mismo instrumento de medición y nunca me he enfrentado a esta situación (normalmente, me ajustar sobre factores de riesgo conocidos, como la edad o el género). [...] Además, dado que usted está interesado en cuestiones de pronóstico (es decir, la eficacia del cuestionario), puede que también le interese también puede estar interesado en estimar el valor predictivo positivo (VPP, probabilidad de que los pacientes con resultados positivos que se clasifican correctamente) clasificado), siempre y cuando se pueda clasificar a los sujetos como "positivos" o "negativos" en función de sus subpuntuación en su cuestionario. No obstante, tenga en cuenta que es necesario conocer la prevalencia de este trastorno para interpretar correctamente el VPP a su vez...
¿Tiene un conocimiento más profundo de esta situación particular, con enlace a los documentos pertinentes cuando sea posible?
Referencias
- Janes, H y Pepe, MS (2008). Ajuste de covariables en estudios de marcadores de diagnóstico, cribado o pronóstico: Un viejo concepto en un nuevo escenario . Revista Americana de Epidemiología , 168(1): 89-97.
- Janes, H y Pepe, MS (2008). Acomodación de covariables en el análisis ROC . Serie de documentos de trabajo sobre bioestadística de la UW , Documento 322.