Si $Y$ tiene más de dos categorías su pregunta sobre la "ventaja" de una regresión sobre la otra probablemente no tenga sentido si se trata de comparar los parámetros de los modelos porque los modelos serán fundamentalmente diferentes:
$\bf log \frac{P(i)}{P(not~i)}=logit_i=linear~combination$ para cada $i$ logística binaria regresión, y
$\bf log \frac{P(i)}{P(r)}=logit_i=linear~combination$ para cada $i$ categoría en logística múltiple regresión, $r$ siendo la categoría de referencia elegida ( $i \ne r$ ).
Sin embargo, si su objetivo es sólo predecir la probabilidad de cada categoría $i$ Cualquiera de los dos enfoques está justificado, aunque pueden dar estimaciones de probabilidad diferentes. La fórmula para estimar una probabilidad es genérica:
$\bf P'(i)= \frac{exp(logit_i)}{exp(logit_i)+exp(logit_j)+\dots+exp(logit_r)}$ , donde $i,j,\dots,r$ son todas las categorías, y si $r$ fue elegido para ser la referencia su $\bf exp(logit)=1$ . Así, para la logística binaria esa misma fórmula se convierte en $\bf P'(i)= \frac{exp(logit_i)}{exp(logit_i)+1}$ . La logística multinomial se basa en la suposición (no siempre realista) de independencia de las alternativas irrelevantes mientras que una serie de predicciones logísticas binarias no.
Un tema aparte es cuáles son las diferencias técnicas entre las regresiones logísticas multinomiales y binarias en caso de que $Y$ es dicotómico . ¿Habrá alguna diferencia en los resultados? La mayoría de las veces, en ausencia de covariables, los resultados serán los mismos, aunque hay diferencias en los algoritmos y en las opciones de salida. Permítame citar la Ayuda de SPSS sobre esta cuestión en SPSS:
Los modelos de regresión logística binaria pueden ajustarse mediante el procedimiento procedimiento de regresión logística o el procedimiento de regresión logística multinomial o el procedimiento de regresión logística multinomial. Cada procedimiento tiene opciones que no están disponibles en el otro. Un distinción teórica importante es que el procedimiento de regresión logística produce todas las predicciones, residuos, estadísticas de influencia y pruebas de bondad de ajuste utilizando datos a nivel de caso individual, independientemente de cómo se introduzcan los datos y de si el número de patrones de covariables es menor que el número total de casos, mientras que el procedimiento de Regresión Logística Multinomial agrega internamente casos para formar subpoblaciones con patrones de covariables idénticos para los de los predictores, produciendo predicciones, residuos y pruebas de bondad de ajuste de ajuste basados en estas subpoblaciones. Si todos los predictores son categóricos o cualquier predictor continuo toma sólo un número limitado de valores -de modo que hay varios casos en cada patrón de covariable distinto- el enfoque de subpoblación puede de covariables, el enfoque de subpoblación puede producir pruebas de bondad de ajuste válidas y residuos informativos. de ajuste y residuos informativos, mientras que el enfoque a nivel de caso individual individual no puede.
Regresión logística ofrece las siguientes características únicas:
- Prueba de Hosmer-Lemeshow de bondad de ajuste del modelo
- Análisis por etapas
- Contrastes para definir la parametrización del modelo
- Puntos de corte alternativos para la clasificación
- Parcelas de clasificación
- Modelo ajustado en un conjunto de casos a un conjunto de casos retenidos
- Guarda las predicciones, los residuos y las estadísticas de influencia
Logística multinomial La regresión ofrece las siguientes características únicas características únicas:
- Pruebas de chi-cuadrado de Pearson y de desviación para la bondad de ajuste del modelo
- Especificación de subpoblaciones para la agrupación de datos para pruebas de bondad de ajuste
- Listado de recuentos, recuentos previstos y residuos por subpoblaciones
- Corrección de las estimaciones de la varianza por exceso de dispersión
- Matriz de covarianza de las estimaciones de los parámetros
- Pruebas de combinaciones lineales de parámetros
- Especificación explícita de los modelos anidados
- Ajuste de modelos de regresión logística condicional emparejados 1-1 utilizando variables diferenciadas
4 votos
Matemáticamente, un modelo logit multinomial es un conjunto de modelos logit binarios, todos ellos comparados con una alternativa base. Pero como se consigue colapsar los parámetros genéricos y quizás combinar algunos otros, el MNL siempre será al menos igual de eficiente (y probablemente más). No veo ninguna razón para utilizar nunca una serie de modelos binomiales.
3 votos
@gmacfarlane: He intentado simular datos en los que MNL sería mejor que las series de regresiones logísticas binarias, pero cada vez en promedio la calidad era la misma. Estuve comparando gráficos de elevación y después de promediar los resultados de algunas simulaciones se veían casi iguales. ¿Tal vez usted tiene una idea de cómo generar datos para que MNL supere a las regresiones logísticas binarias? Aunque MNL tenía una gran ventaja, sus resultados podían interpretarse como probabilidad.
0 votos
La regresión logística multinomial es la extensión de la regresión logística binaria. Se utiliza cuando las variables dependientes del estudio son tres o más, mientras que el logit binario se utiliza cuando las variables dependientes del estudio son dos.
1 votos
Para el lector: Recomiendo empezar por la respuesta de @julieth y seguir leyendo la de ttnphns. Creo que la primera responde más directamente a la pregunta original, pero la segunda añade un contexto interesante. ttnphns también muestra las diferentes características que están disponibles para ambos en una rutina de software popular, lo que podría constituir en sí mismo una razón para utilizar uno sobre el otro (véase la declaración de gregmacfarlane).