Hace unos años que no encajo un modelo mixto, así que me he metido en una sesión de repaso masivo de viejos apuntes, libros (Pinheiro y Bates, Faraway, etc) y repasando los posts en SO y CV sobre modelos mixtos. Ha sido estupendo, pero me quedan algunas dudas que probablemente sean tan básicas que se pasan por alto en la mayoría de estos materiales.
El conjunto de datos con el que estoy trabajando tiene una columna de tiempo que empieza en 1 y llega a 38 por periodo. También tengo 3 variables, una para cada, año, trimestre y periodo. En mi efecto fijo, ¿debería modelar ventas~Tiempo+trimestre+año+periodo o debería ignorar las variables de trimestre, año y periodo y sólo utilizar mi variable de tiempo agregada? ¿Debería poner ordered(time) ahí? Por un lado, imagino que tener las variables adicionales de trimestre/periodo/año podría ser redundante, puesto que ya están en la variable de tiempo, pero al mismo tiempo, podría ser bueno intentar utilizarlas para controlar la estacionalidad.
Me pregunto si mi efecto fijo debería ser
Sales~Time+Quarter+year+period+Region+Policy
o
Sales~Time+Region+Policy
Además, si alguien tiene consejos sobre el ajuste de modelos con más de 1 o dos efectos aleatorios, se lo agradecería mucho. En todas mis notas, la mayoría de las veces se trata de diseños específicos con 1 efecto aleatorio (a veces intercepción y a veces pendiente + intercepción), pero rara vez son múltiples. Actualmente estoy tratando de ver 5 variables que me gustaría que fueran efectos aleatorios (al menos mirarlas). ¿Es tan sencillo como (1|A) + (1|B) + (1|C) + etc en lmer? ¿Algún problema en el que me esté metiendo?
Gracias como siempre CV.
Edición: Me interesa un cambio de política que ha perjudicado potencialmente las ventas. Tengo un conjunto de datos de 3 años y en medio de ese conjunto de datos cambiamos nuestra política y estoy ajustando LMM para ver primero si realmente hay un efecto negativo y segundo para obtener una vaga idea de lo grande que es, si es una disminución de 0,001%, no nos importa, pero si es un número más grande debe ser examinado más a fondo (que naturalmente será mi próxima tarea).
Edit2: Para los efectos aleatorios (que todavía estoy en el proceso de jugueteo con) Tengo el producto, que está pagando y la cantidad de compra. Lo que hace el corte aquí es todavía un trabajo en progreso, actualmente utilizando LRT y AIC (principalmente AIC, porque parece que hay reservas sobre LRT con lmer a veces). Hay 38 meses en el conjunto y cada mes tiene valores de ventas para cada tipo de pago recibido (hay 5), cada producto vendido (3), la región en la que se vende (~30 aquí). Las otras variables que tengo son las ventas, el número de cosas vendidas, el equipo que hizo la venta (sólo porque el cambio de política se relaciona con él) y una variable ficticia para el cambio de política. El modelo en el que estoy trabajando ahora mismo es algo parecido:
m1 = lmer(Sales~ Time+Policy+Team+(Product|Territory)+(salesqty|Territory)+ (payer|Territory), data=data )
Aunque como he dicho, esto no es en absoluto definitivo, sólo lo que tengo funcionando en R en este momento.