Valido el uso de una puntuación clínica cardiovascular para predecir el riesgo de demencia utilizando datos de un estudio longitudinal. Por lo tanto, mi resultado es binario (demencia sí o no) y la variable independiente (la puntuación) es continua, por supuesto tengo todo un conjunto de covariables.
Hice un análisis de Cox para evaluar una asociación entre los valores de referencia y el resultado a lo largo del tiempo, pero ahora me gustaría validar el uso de la puntuación. He pensado en tomar una submuestra aleatoria de mi cohorte para dividirla en entrenamiento y prueba y ejecutar algún tipo de estadística de validación (es decir, curvas ROC), pero tengo algunas dudas sobre esto por una serie de razones:
- Mi muestra es relativamente pequeña ( $n=2500$ ), y me temo que tomar una submuestra reduciría demasiado la potencia.
- No estoy seguro de que el ROC (o alternativamente el somerset) sean las mejores pruebas en este caso, ya que otras pruebas (como las utilizadas en la evaluación de cribados) pueden ser más adecuadas.
¿Cómo debo evaluar el uso de esta puntuación? ¿Puede sugerir pruebas que se adapten mejor al problema?
Para el análisis de datos utilizo Stata.