3 votos

Variable temporal en el conjunto de datos longitudinales pregunta del modelo mixto

Hace unos años que no encajo un modelo mixto, así que me he metido en una sesión de repaso masivo de viejos apuntes, libros (Pinheiro y Bates, Faraway, etc) y repasando los posts en SO y CV sobre modelos mixtos. Ha sido estupendo, pero me quedan algunas dudas que probablemente sean tan básicas que se pasan por alto en la mayoría de estos materiales.

El conjunto de datos con el que estoy trabajando tiene una columna de tiempo que empieza en 1 y llega a 38 por periodo. También tengo 3 variables, una para cada, año, trimestre y periodo. En mi efecto fijo, ¿debería modelar ventas~Tiempo+trimestre+año+periodo o debería ignorar las variables de trimestre, año y periodo y sólo utilizar mi variable de tiempo agregada? ¿Debería poner ordered(time) ahí? Por un lado, imagino que tener las variables adicionales de trimestre/periodo/año podría ser redundante, puesto que ya están en la variable de tiempo, pero al mismo tiempo, podría ser bueno intentar utilizarlas para controlar la estacionalidad.

Me pregunto si mi efecto fijo debería ser

Sales~Time+Quarter+year+period+Region+Policy

o

Sales~Time+Region+Policy

Además, si alguien tiene consejos sobre el ajuste de modelos con más de 1 o dos efectos aleatorios, se lo agradecería mucho. En todas mis notas, la mayoría de las veces se trata de diseños específicos con 1 efecto aleatorio (a veces intercepción y a veces pendiente + intercepción), pero rara vez son múltiples. Actualmente estoy tratando de ver 5 variables que me gustaría que fueran efectos aleatorios (al menos mirarlas). ¿Es tan sencillo como (1|A) + (1|B) + (1|C) + etc en lmer? ¿Algún problema en el que me esté metiendo?

Gracias como siempre CV.

Edición: Me interesa un cambio de política que ha perjudicado potencialmente las ventas. Tengo un conjunto de datos de 3 años y en medio de ese conjunto de datos cambiamos nuestra política y estoy ajustando LMM para ver primero si realmente hay un efecto negativo y segundo para obtener una vaga idea de lo grande que es, si es una disminución de 0,001%, no nos importa, pero si es un número más grande debe ser examinado más a fondo (que naturalmente será mi próxima tarea).

Edit2: Para los efectos aleatorios (que todavía estoy en el proceso de jugueteo con) Tengo el producto, que está pagando y la cantidad de compra. Lo que hace el corte aquí es todavía un trabajo en progreso, actualmente utilizando LRT y AIC (principalmente AIC, porque parece que hay reservas sobre LRT con lmer a veces). Hay 38 meses en el conjunto y cada mes tiene valores de ventas para cada tipo de pago recibido (hay 5), cada producto vendido (3), la región en la que se vende (~30 aquí). Las otras variables que tengo son las ventas, el número de cosas vendidas, el equipo que hizo la venta (sólo porque el cambio de política se relaciona con él) y una variable ficticia para el cambio de política. El modelo en el que estoy trabajando ahora mismo es algo parecido:

m1 = lmer(Sales~ Time+Policy+Team+(Product|Territory)+(salesqty|Territory)+ (payer|Territory), data=data ) 

Aunque como he dicho, esto no es en absoluto definitivo, sólo lo que tengo funcionando en R en este momento.

1voto

Peter Puntos 1

Tienes bastantes variables potenciales para incluir en tu modelo, y creo que hay una posibilidad real de infravalorar el análisis. En inglés: Creo que quieres ajustar el modelo más simple que puedas. Si desea incluir Quarter , year o period tendrá que especificarlas como factores (es posible que ya lo haya hecho) o bien ajustar un conjunto de variables ficticias, utilizando as.factor es mucho más fácil. :)

Yo probaría primero este sencillo modelo:

lmer(Sales ~ Policy + Quarter + (1|Time), data=data)

Creo que el Quarter factor es mejor para tratar de captar la tendencia - es un subconjunto más pequeño de year y no incluiría otros factores como Region o Team todavía, ya que eso complicaría el modelo. Estás buscando un efecto principal para Policy . He incluido Time como un efecto aleatorio ya que creo que es la mejor manera de captar la idea de que el Sales varían aleatoriamente en el tiempo, y queremos generalizar el efecto de la política en el tiempo, por lo que Time no debe ajustarse como un efecto fijo.

Si lo desea, puede empezar a añadir más variables adicionales una por una y luego comparar los resultados del modelo utilizando aov asumiendo que está almacenando el lmer resultados. Pero yo no empezaría con un modelo complicado primero.

Actualización: la razón por la que sugiero Time como efecto aleatorio es que tienes puntos de tiempo antes y después de la implementación de la política que no están en tus datos. Además, con el modelo simple que he sugerido, hay medidas repetidas en cada punto de tiempo, desde la región, el equipo de ventas, etc, que no están en el modelo, por lo que creo que usar Time en este modelo como efecto aleatorio es la mejor manera de representar toda esa complejidad subyacente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X