Tengo una gran cantidad de datos observacionales longitudinales multinivel de la concentración de ciertos productos químicos recogidos en varios sitios durante 10 años (1990-2010). Los sitios se clasifican en diferentes tipos de sitios como A, B y C. En el conjunto de datos, la variable del año se codifica como 1990, 1991, 1993, etc. En un año, puede haber muchas muestras recogidas en un sitio. No es que haya sólo un punto de datos en un período de 1 año por sitio (como muchos datos longitudinales experimentales en los que hay mediciones repetidas por 1 sujeto y sólo hay un punto de datos en cada punto de tiempo). Algunos sitios también han cerrado a lo largo de los años, pero los estoy agrupando en grupos porque no me interesan los sitios individuales.
str(datos)
data.frame': 60.000 obs. de 22 variables:
$ ID : int... 3453, 3492, 4385
$ SiteID : Factor w/ 15000 levels "1234","1235”, “1236”, ecttg
$ Year : int 1993 1993 1993 1993 1993 1993 1993 1993 1993 1993 ...
$ NewCom.Group: Factor w/ 5 levels "A”, “B”, “C",..: 1 1 1 1 2
$ NewLoc.Group: Factor w/ 3 levels "","Type1",”Type2 “,..: 1 2 1
$ NewJobGroup : Factor w/ 4 levels "Production",..: 4 2 4 2 2
$ NewIndJob : Factor w/ 109 levels "TramOp",..: ..
$ Log.conc : num -0.5978 -0.0726 -0.7765 -1.1712 -1.273 ...
$ Log.Qconc : num 3.5 3.14 3.76 2.89 3.09 ...
Me gustaría ver si la concentración ha disminuido a lo largo de los años y por grupos.
Mi modelo mixto es algo así:
Model.1 = lme(log.conc ~ Year + NewCom.Group, random=~1|siteID, data=data)
Mi pregunta es cómo debo tratar Year
variable para responder a la cuestión de la concentración a lo largo de los años.
-
¿Debo recodificar el año como 1, 2, 3, 4 y dejarlo como continuo?
-
¿Debo recodificar el año como 1, 2, 3, 4 y hacerlo categórico?
Time <- factor(Time)
-
Dejar el año como está y tratarlo como variable continua (¿Es lo mismo que en 1?)
-
Que sea categórico,
Year <- factor(Year)
Sólo quiero asegurarme de que el modelo no compara la concentración de los años siguientes con el primer año solamente.
¿Qué implica cada una de esas opciones en la interpretación del resultado?