Estoy trabajando con un conjunto de datos con 2-3 variables de respuesta y 7 variables predictoras. Todas las variables son categóricas. Si se tratase de una variable de respuesta, creo que un modelo logit multinomial sería el modelo adecuado, pero hay 2 o 3. Así que mi pregunta es: ¿existe una versión multivariante del modelo logit multinomial?
He mirado en varios libros sobre datos categóricos, pero no he visto nada como esto (principalmente mediante el uso de Agresti 2002).
Tengo unos 2000 observaciones, aunque probablemente voy a necesitar para dividirlo en 2 o 3 subconjuntos de datos para ver realmente lo que está pasando. Una cosa que estaba pensando es convertir a cuenta y utilizar un modelo para datos de conteo. Yo también podría combinar el 2-3 respuesta a los vars en 1 categórica con un montón de categorías, pero creo que va a disminuir las posibilidades de que cualquier cosa que muestra que para cualquiera de las categorías. Yo también podría hacer 2-3 modelos separados, uno para cada variable, lo que obviamente no es tan bueno.
También podría ser capaz de deshacerse de algunos de los predictores (creo que 3 de los 7 tienen el mayor poder explicativo). No me opongo al uso de métodos de aprendizaje automático, he encontrado algunas cosas interesantes ya con árboles de decisión.
gracias,
-pablo