2 votos

Regresión múltiple en R con diferentes tipos de datos predictores

Mi objetivo es investigar una variable dependiente que es métrica (tiempo en horas). Las variables independientes incluyen 3 métricas, 2 binarias (factores) y una variable factorial, que consiste en 11 distritos de una ciudad.

He intentado realizar un MLG.

¿Puedo reunir todo esto en un modelo? Parece que es difícil interpretar el resultado. ¿Debería utilizar más bien modelos diferentes/varios, con un solo factor por regresión? Si utilizo el MLG, ¿qué tipo de familia y función de enlace debería utilizar?

El tiempo de inactividad parece ser una distribución sesgada a la derecha, por lo que he elegido una familia gamma con una función de enlace inversa.

El resultado de un modelo que contiene todas las variables independientes descritas anteriormente:

enter image description here

¿Cómo puedo eliminar las AN? ¿O qué significan realmente?

Además, se ha realizado la prueba ANOVA para examinar más de cerca la variable de distrito denominada Bezirk, ¡que muestra enormes diferencias en el valor medio! ¿Es esto coherente con los pequeños coeficientes de la regresión GLM? (Las medias varían entre 3,7 en T.Mitte y 15 en T.Treptow)

Saludos cordiales

4voto

AdamSane Puntos 1825

¿Puedo reunir todo esto en un modelo?

Ciertamente.

Parece que es difícil interpretar el resultado.

Tal vez, pero esta es una tarea común. Hay consejos sobre este tipo de interpretación para modelos de regresión lineal y glms disponibles aquí y en otros lugares.

¿Debería utilizar más bien modelos diferentes/varios, con un solo factor por regresión?

No. Esto puede dar impresiones muy engañosas.

Véase, por ejemplo, La paradoja de Simpson .

En el caso de datos continuos y mixtos puede recibir otros nombres (paradoja de Lord, efecto de supresión). Véase, por ejemplo Tu, Gunnell & Gilthorpe (2008) $^{[1]}$ .

Si utilizo el MLG, ¿qué tipo de familia y función de enlace debo utilizar?

No hay suficiente información aquí para decirlo, pero los tiempos suelen ser asimétricos y heteroskedásticos, así que probablemente empezaría por considerar un GLM gamma.


[1]: Tu Y.K., Gunnell D., Gilthorpe M.S. (2008),
"La paradoja de Simpson, la paradoja de Lord y los efectos de supresión son el mismo fenómeno: la paradoja de la inversión".
Emerg Themes Epidemiol. Jan; 5 :2.
doi: 10.1186/1742-7622-5-2.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X