¿Cuáles son los supuestos adecuados detrás de regresión logística multinomial? Y ¿cuáles son los mejores exámenes para satisfacer estos supuestos en algún software estadístico? ¿Qué otros modelos adecuados, si estos supuestos no se cumplen?
- Supuestos de regresión logística multinacional (3 respuestas )
Respuestas
¿Demasiados anuncios?Supuestos:
- Resultados de la siguiente manera categórica distribución (http://en.wikipedia.org/wiki/Categorical_distribution), que está vinculado a las covariables a través de una función de enlace como en el ordinario de regresión logística
- La independencia de las unidades observacionales
- Relación lineal entre las covariables y (link-transformados) expectativa de los resultados
Para la hipótesis 1 que se cumplan, las categorías de su resultado deben ser exclusivo (no se solapan) y exhaustiva (que abarca todas las formas posibles el resultado puede tomar).
Realmente no sé si hay alguna adecuado de los tests estadísticos para la hipótesis 2. Para datos de series de tiempo no es una prueba de autocorrelación llamado de Durbin-Watson prueba. Para otras formas de datos correlacionados, creo que en lugar de tomar esa decisión basada en consideraciones teóricas (por ejemplo, si los datos son derivados de un clúster-procedimiento de muestreo, es de esperar que los datos dentro de los grupos correlacionados).
Como por hipótesis 3, en la regresión logística binaria puede parcela agrupada de los residuos en contra de estimaciones de la probabilidad a ver si la media de los residuales es de alrededor de 0 en todo el rango de estimaciones de la probabilidad. Supongo que esto se puede generalizar a la regresión multinomial haciendo (k-1) dichas parcelas lugar para las diferentes categorías de un resultado con k categorías.
EDITAR:
En cuanto a la variante de los modelos: la Hipótesis 1 es bastante sencillo de cumplir. Usted podría tener problemas, porque usted tiene que calcular un gran número de parámetros (k-1 conjuntos diferentes de la intercepta y la pendiente de los parámetros). En tal caso, usted podría, por ejemplo, el colapso de los resultados en un resultado binario y hacer una regresión logística simple.
Si la hipótesis 2 es violados, usted podría utilizar un modelo mixto, que permite especificar una dependencia de la estructura
Como para la hipótesis 3, se podía transformar variables de las que se sospecha que tienen un no-efecto lineal. Un común transformación es, por ejemplo, para incluir la edad al cuadrado en la salud relacionados con los resultados.
@h_bauer ha proporcionado una buena respuesta. Permítanme añadir una pequeña complementarios punto: también puedes probar una relación curvilínea agregando curvilíneo términos y la realización de un modelo anidado de prueba. Por ejemplo, imagine que usted tiene $X_1$ como variable explicativa, pero no estás seguro de si la relación entre ella y el vínculo transformado expectativa es una línea recta. Se podría formar un nuevo modelo mediante la adición de $X_1^2$, e $X_1^2$, y luego prueba a ver si el nuevo modelo se ajusta mejor que el modelo original.
Otra suposición de modelos lineales generalizados, como la logística multinomial, es que la función de enlace es correcto. Estrictamente hablando, multinomial logístico de regresión se utiliza sólo el logit enlace, pero hay otro modelo multinomial posibilidades, tales como la multinomial probit. Muchas personas (un poco descuidada) se refieren a cualquier modelo como "logística", que significa sólo que la variable de respuesta es categórica, pero el término realmente sólo correctamente se refiere a la logit enlace. Para más información sobre los enlaces, puede ayudar a leer mi respuesta aquí: Diferencia entre los modelos logit y probit.
Con respecto a abordar las violaciones de estos supuestos, es bastante autoexplicativo. Si las observaciones no son independientes, se puede añadir la correspondiente fijos o de efectos aleatorios para hacerlos así. Si la relación con un predictor no es lineal, puede agregar variables transformadas por lo que es lineal en las aumentada predictor espacio. Si el enlace no es apropiado, se puede cambiar, etc. En general, la regresión logística multinomial no hacer muy restrictiva supuestos.