3 votos

interacciones entre niveles

Dado un conjunto de datos como el siguiente

day      id  time_with_new_teach time_in_prog dur_train dur_appr age graduated
2020-01  02  20                  35           4         9        20  no
2020-01  19  10                  20           9         19       20  no
2020-02  02  21                  36           5         10       21  yes
2020-01  03   1                   4           3          7       29  no
....
2020-01  09  24                  45           20        19       20  yes

Utilizando como resultado la graduación, ¿qué tipo de modelo/paquetes puedo utilizar para determinar el impacto del cambio de profesores (time_with_new_teach) y el tiempo en el programa (time_in_prog) en la probabilidad de graduación? Idealmente me gustaría saber si cambias de profesor en 6 meses, tu probabilidad de graduación aumenta o disminuye en un x%. También para las personas con un tiempo en el programa superior a 20 meses (time_in_prog > 20), cambiar de profesor en 6 meses (time_in_prog <= 6) conduce a una disminución del x% en la probabilidad de graduación.

2voto

Bruce ONeel Puntos 391

El resultado graduated es binario, por lo que se necesita un modelo para datos binarios, como un modelo logístico.

Parece que hay medidas repetidas dentro de id por lo que hay que tener en cuenta las correlaciones dentro de id . Se podría utilizar un modelo con efectos aleatorios para id para hacerlo.

Para responder a sus preguntas de investigación puede ajustar un modelo con efectos fijos para time_with_new_teach y time_in_prog y posiblemente la interacción entre ellos.

Dado que parece estar interesado en un punto de corte para estas variables, entonces puede querer dicotomizarlas - sin embargo, esto siempre resulta en una pérdida de poder estadístico y podría darse el caso de que haya asociaciones interesantes entre las variables que se perderán si dicotomiza, por lo que sugeriría encarecidamente intentar trabajar con las variables originales primero.

Este modelo sería un modelo lineal mixto generalizado (glmm) y, utilizando la función de enlace logit, modelará las probabilidades de graduación, de modo que se puedan obtener los cocientes de probabilidades para los efectos fijos, es decir, el % de cambio en las probabilidades de graduación entre para un cambio de 1 unidad en las variables (si se utilizan las variables originales), o entre los grupos (si se utilizan variables dicotomizadas)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X