Dado un conjunto de datos con resultados binarios $y\in\{0,1\}^n$ y alguna matriz de predicción $X\in\mathbb{R}^{n\times p}$ el modelo de regresión logística estándar estima los coeficientes $\beta_{MLE}$ que maximizan la probabilidad binomial. Cuando $X$ es de rango completo $\beta_{MLE}$ es única; cuando la separación perfecta no está presente, es finita.
¿Este modelo de máxima verosimilitud también maximiza el AUC del ROC (también conocido como $c$ -), o existe alguna estimación del coeficiente $\beta_{AUC} \neq \beta_{MLE}$ ¿cuál obtendrá un AUC ROC más alto? Si es cierto que la MLE no maximiza necesariamente el ROC AUC, entonces otra forma de ver esta pregunta es "¿Existe una alternativa a la maximización de la verosimilitud que siempre maximizará el ROC AUC de una regresión logística?"
Estoy asumiendo que los modelos son, por lo demás, los mismos: no estamos añadiendo o eliminando predictores en $X$ o cambiar la especificación del modelo, y asumo que los modelos de maximización de la verosimilitud y de AUC utilizan la misma función de enlace.
4 votos
Seguramente $\beta_{\text{AUC}} \neq \beta_{\text{MLE}}$ si, por ejemplo, alguna función de enlace genera un ajuste mejor que un logit? Aparte de eso, buena pregunta, si el proceso de generación de datos puede asumirse como logit.
0 votos
Buena pregunta, pero considere lo siguiente. ROC y AUC se utilizan para comparar dos modelos diferentes, por lo que si una solución para la estimación MLE de cualquier modelo es única, esto significa que usted puede obtener un AUC diferente sólo si cambia la especificación del modelo actual y estima un nuevo modelo diferente a través de MLE. Así que en este punto otra pregunta sería: ¿hay algún otro método de estimación "mejor" (algoritmo de maximización ecc) que no sea el simple MLE aplicable al mismo modelo de tal manera que llegue a diferentes estimaciones de los coeficientes que conduzcan a nuevas betas "mejores" con mayor AUC?
0 votos
@Nutle exactamente, eso sería una especificación diferente
0 votos
@Fr1 Sí, eso es lo que significa único. Lo que insinúo en mi pregunta es algo así como "¿y si hay alguna alternativa al MLE que consiga un AUC mayor?". Si es cierto que hay un modelo lineal diferente (un modelo que no sea el MLE) que consigue un AUC más alto, entonces sería interesante saberlo.
0 votos
@Nutle: Supongo que el OP quiere decir $\beta_{AUC}$ en el que el modelo básico es el mismo . De lo contrario, "tal vez probit" es una respuesta suficiente :)
0 votos
@Nutle Por eso he editado mi pregunta para especificar "Asumo que los modelos de maximización de verosimilitud y de maximización de AUC utilizan la misma función de enlace".
0 votos
@Sycorax exactamente esta es una pregunta tremendamente buena. Creo que la respuesta puede estar en la optimización numérica, que son cosas que suelo dejar a mis amigos matemáticos porque conocen la respuesta mejor que yo. En este caso, efectivamente, podríamos decir: "dado que existe una verdadera relación oculta entre predictores y variable dependiente, ¿es el MLE la mejor forma posible de recuperar esta verdadera relación?". Buena pregunta. Conceptualmente, esto implicaría probablemente encontrar una nueva forma de definir una función de coste para la optimización y/o encontrar mejores métodos de optimización.
0 votos
Por ejemplo, en lugar de encontrar el coeficiente que maximice la probabilidad, encontrar el coeficiente que minimice una determinada función de coste que funcione especialmente bien con una variable dep 1-0, basándose en datos simulados . Sólo estoy pensando en voz alta, porque la pregunta es interesante. Evidentemente no conozco la respuesta, pero creo que hay gente investigando en ello. Al menos yo conozco a gente que investiga nuevos métodos numéricos, pero ambas cosas no son exactamente lo mismo.
1 votos
@Sycorax ¿qué más suponemos?:) Las suposiciones son importantes, ya que si conozca la verdadera DGP con enlace y variables utilizadas, el MLE es uniformemente el estadístico insesgado más potente.
0 votos
@Nutle No creo que sean necesarias más suposiciones. Si tu observación sobre las buenas propiedades del MLE en ciertos escenarios es relevante, entonces quizás podríamos usar esa observación para mostrar que el MLE corresponde al AUC más alto entre los modelos lineales con un cierto enlace. Supongo que yo esperaría que el MLE también implica que usted tiene el mejor AUC entre esa familia de modelos, pero no es obvio para mí por qué ese debe ser el caso.