6 votos

Uso de la regresión logística multinomial para resultados relacionados múltiples

¿Es una práctica habitual (y adecuada) reagrupar dos variables dependientes binarias en una única variable dependiente de 4 niveles para aprovechar las ventajas de la regresión multinomial? Por ejemplo, digamos que tenemos información sobre dos condiciones relacionadas (resultados) A y B. Se definiría una nueva variable de 4 niveles tal que

category 1 = Neither conditions A nor B
category 2 = Condition A (only)
category 3 = Condition B (only)
category 4 = Both conditions A and B

Esto permite ejecutar una única regresión multinomial en lugar de utilizar dos modelos logísticos binarios que incluyen los mismos predictores.

0 votos

¿Podría decirnos qué está haciendo? Además, ¿este modelo no tendría 4 categorías (que no sean ni A ni B)?

0 votos

@Peter esto es estrictamente teórico. Estoy siguiendo una clase en este momento y el profesor utiliza MLR de esta manera y estoy pensando que podría estar estirando un poco la noción de un solo resultado que tiene "categorías mutuamente excluyentes". Tienes razón en lo que respecta a la cuarta categoría, voy a hacer una edición para eso.

4voto

James Sutherland Puntos 2033

Como sugiere @Riaz Rizvi, esto puede no ser una buena idea.

Su esquema impone una estructura de covarianza particular (y bastante improbable) en el problema al aplanar a un multinomio de esta manera. Dado que usted sospecha, o al menos desea permitir la posibilidad de que la presencia de A sea informativa de B, entonces debería trabajar con un probit bivariado . Trabajar con dos modelos logísticos separados no va a poder representar esto. El modelo es una regresión con una variable latente bivariada explícita que genera las probabilidades de elección, tal y como se discute brevemente en el enlace y con mayor profundidad en los buenos textos de econometría.

1 votos

Me confunde que en tu enlace el probit bivariado es un modelo multinomial y sin embargo dices que usarlo no es una buena idea. ¿Quieres decir que es una mala idea utilizar dos modelos logísticos o probit separados en lugar de uno multinomial? ¿O me he perdido algo?

0 votos

El ejemplo de esa página es un probit bivariante, pero aquí hay un exposición dirigida

0 votos

Pero bien pillado con la referencia multinomial, lo cambiaré en la respuesta.

1voto

andynormancx Puntos 234

Un multinomio está perfectamente bien en esta situación, pero tiene dos costes:

  • Una explosión en el número de parámetros. (Si se combinara $n$ variables binarias como esta, tendrías $2^n$ en lugar de los parámetros originales $n$ .)
  • La solución es más difícil de interpretar si las variables originales son realmente independientes. (Si hubiera tenido una relación simple tal que la variable de entrada $x$ implica la variable dependiente $y=1$ , ahora tendrías $x$ implica que la variable dependiente combinada adopta uno de los muchos resultados correspondientes a $y=1$ .)

La mayor ventaja es que su modelo puede utilizar los parámetros adicionales para codificar distribuciones que no son posibles en el modelo original.

0voto

Steven Noble Puntos 2847

No lo creo. La distribución multinomial se deriva de n variables independientes, pero tu situación tiene dos variables dependientes. Una regresión multinomial no es aplicable en este caso.

1 votos

¿Podría explicar esto un poco más? No entiendo por qué dices que una distribución multinomial se deriva de $n$ independiente variables . ¿Se refiere a los resultados? Los resultados son definitivamente dependientes ya que son mutuamente excluyentes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X