10 votos

AUC en regresión logística ordinal

Utilizo dos tipos de regresión logística: una es del tipo simple, para clasificación binaria, y la otra es regresión logística ordinal. Para calcular la precisión de la primera, he utilizado la validación cruzada, donde he calculado el AUC para cada pliegue y luego calculé el AUC medio. ¿Cómo puedo hacerlo para la regresión logística ordinal? He oído hablar del ROC generalizado para predictores multiclase, pero no estoy seguro de cómo calcularlo.

Gracias.

1 votos

No AUC, sino relacionadas: en las curvas de precisión-recuerdo micro/macro en stats.stackexchange.com/questions/21551/

6voto

dan90266 Puntos 609

Sólo me gusta el área bajo la curva ROC ( $c$ -índice) porque resulta ser una probabilidad de concordancia. $c$ es un bloque de construcción de coeficientes de correlación de rango. Por ejemplo, el coeficiente $D_{xy} = 2\times (c - \frac{1}{2})$ . Para ordinal $Y$ , $D_{xy}$ es una excelente medida de discriminación predictiva, y el R rms proporciona métodos sencillos para obtener estimaciones corregidas por sobreajuste bootstrap de $D_{xy}$ . Se puede hacer una resolución inversa para un $c$ -índice (AUROC generalizado). Hay razones para no considerar cada nivel de $Y$ por separado porque así no se aprovecha la naturaleza ordinal de $Y$ .

En rms existen dos funciones para la regresión ordinal: lrm y orm , este último de gestión continua $Y$ y proporcionar más familias de distribución (funciones de enlace) que probabilidades proporcionales.

0 votos

La cuestión principal será cómo calcula rms el $c-index$ utilizado en Sommer's $D_{xy}$ ?

1 votos

Se escribe Somer's . El sistema generalizado $c$ -se calcula simplemente resolviendo la ecuación anterior. Internamente, todas las combinaciones posibles de observaciones con diferentes $Y$ y la estimación de la probabilidad de concordancia se basa en la fracción de pares cuyas predicciones coinciden. Me he equivocado en una cosa: la orm utiliza la función $\rho$ en lugar de $D_{xy}$ .

0 votos

Gracias por la corrección ortográfica. En regresión ordinal será mucho más interesante no sólo mirar el ordenamiento por pares como se hace en la función orm que mencionas, sino también mirar el ordenamiento consistente ( con operadores ternarios o superiores) dependiendo del número de clases que tengas. En resumen lo que digo es: con una regresión logística acumulativa ajustada por ejemplo, la ordenación de las clases se tiene en cuenta en el modelo. Una medida predictiva también debería ser capaz de no hacer comparación por pares $P(pred_1<pred_2|obs_1<obs_2)$ pero la comparación de la forma $P(pred_1<pred_2<pred_3|obs_1<obs_2<o

3voto

daniel Puntos 11

El AUC para la regresión ordinal es algo complicado. Es posible que desee calcular el AUC para cada clase mediante la creación de variables ficticias para tomar el valor 1 para la clase que está calculando el AUC y 0 para el resto de las otras clases. Si tiene 4 clases, creará 4 AUC y las representará en el mismo gráfico. El principal problema de este método es que penaliza por igual las clasificaciones erróneas. De forma mucho más intuitiva, clasificar erróneamente una clase 1 en la clase 3 debería ser peor que clasificar erróneamente una clase 1 en la clase 2.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X