35 votos

comparación entre lme y lmer

Me preguntaba si alguien podría aclararme las diferencias actuales entre estas dos funciones. He encontrado la siguiente pregunta: ¿Cómo elegir la biblioteca R nlme o lme4 para los modelos de efectos mixtos? pero eso data de hace un par de años. Eso es toda una vida en los círculos del software.

Mis preguntas específicas son:

  • ¿Existen (todavía) estructuras de correlación en lme que lmer no se maneja?
  • ¿Es posible/recomendable utilizar lmer para datos de panel?

Pido disculpas si esto es algo básico.

Un poco más de detalle: los datos de panel son aquellos en los que tenemos múltiples mediciones sobre los mismos individuos, en diferentes momentos. Por lo general, trabajo en un contexto empresarial, en el que se pueden tener datos de clientes repetidos o a largo plazo durante varios años. Queremos tener en cuenta la variación a lo largo del tiempo, pero está claro que ajustar una variable ficticia para cada mes o año es ineficiente. Sin embargo, no tengo claro si lmer es la herramienta adecuada para este tipo de datos, o si necesito las estructuras de autocorrelación que lme tiene.

19voto

Ben Bolker Puntos 8729

ACTUALIZACIÓN JUNIO 2016:

Consulte la entrada del blog de Ben en la que se describen sus ideas actuales para conseguirlo en lme4 : Braindump 01 de junio de 2016

Si prefiere los métodos bayesianos, el brms del paquete brm admite algunas estructuras de correlación: Página CRAN brms . (Nota especialmente: "A partir de la versión 0.6.0 de brms, la estructura AR se refiere a los efectos autorregresivos de los residuos para que coincida con la denominación y la implementación en otros paquetes como nlme". Anteriormente, el término AR en brms se refería a los efectos autorregresivos de la respuesta. Estos últimos se denominan ahora efectos ARR y pueden modelarse utilizando el argumento r en las funciones cor_arma y cor_arr.")


RESPUESTA ORIGINAL JULIO 2013:

(Convertido de un comentario.)

Yo diría que lmer sería bastante bueno con un efecto aleatorio del año y un efecto aleatorio del cliente (digamos que sólo tiene una medición por cliente al año);

lmer(y~1 + (1|year) + (1|customer), ...)

se ajustaría al modelo (sólo de intercepción)

$$ Y_{ij} \sim \text{Normal}(a + \epsilon_{\text{year},i} + \epsilon_{\text{customer},j}, \sigma^2_0) $$ donde $\epsilon_{\text{year}}$ y $\epsilon_{\text{customer}}$ son variantes normales de media cero con sus propias varianzas específicas.

Este es un modelo bastante aburrido, tal vez quiera añadir una tendencia general (de efecto fijo) del tiempo y también considerar una interacción aleatoria tiempo-cliente (es decir, pendientes aleatorias). Creo que

lmer(y~year + (1|year) + (year|customer), ...)

debe ajustarse al modelo $$ Y_{ij} \sim \text{Normal}((a + \epsilon_{\text{customer},j}) + (b + \epsilon_{\text{year} \times \text{customer},j}) \cdot \text{year} + \epsilon_{\text{year},i}, \sigma^2_0) $$

(utilizando year es una excepción a la regla habitual de no incluir una variable de entrada como efecto ajustado y aleatorio en el mismo modelo, siempre que sea una variable numérica, year se trata como continuo en el efecto fijo y el year:customer interacción (aleatoria) y como categórica en el efecto aleatorio ...)

Por supuesto, es posible que desee añadir covariables a nivel de año, a nivel de cliente y a nivel de observación que absorban parte de la varianza relevante (por ejemplo, añadir el índice de precios al consumo medio para explicar por qué años fueron malos o buenos...)

Lo ideal sería también tener en cuenta la autocorrelación temporal dentro de las series temporales de cada cliente, algo que por el momento no es posible con lmer ...pero podrías comprobar la función de autocorrelación temporal para ver si eso es importante...

Caveat : No sé mucho sobre los enfoques estándar para el manejo de datos de panel; esto se basa sólo en mi conocimiento de los modelos mixtos. Los comentaristas (o editores) deberían sentirse libres de intervenir si esto parece violar las prácticas estándar/mejores en econometría.

4voto

alexs77 Puntos 36

¡Para responder directamente a sus preguntas, y NB esto es años después del post original!

  • Sí, todavía hay estructuras de correlación que nlme maneja y que lme4 no maneja. Sin embargo, mientras nlme permita al usuario definir correlaciones generales y lme4 no, este será el caso. Esto tiene sorprendentemente poco impacto práctico. Las "tres grandes" estructuras de correlación de: Independiente, Intercambiable, y las estructuras de correlación AR-1 son fáciles de manejar por ambos paquetes.

  • Es ciertamente posible . Usted puede ajustar los datos del panel con el lm También la función. Mi recomendación sobre cuál utilizar depende del problema. lme4 es un conjunto de herramientas mucho más pequeño, y la representación de la fórmula es una forma clara y concisa de representar algunos modelos de efectos mixtos muy comunes. nlme es la gran caja de herramientas, que incluye un soldador TIG para fabricar cualquier herramienta que necesite.

Usted dice que quiere permitir la "variación en el tiempo". Esencialmente, una estructura de correlación intercambiable logra esto, permitiendo un intercepto aleatorio en cada cluster, de modo que la varianza intracluster es la suma de la variación a nivel de cluster así como (lo que usted llama) la variación en el tiempo. Y esto no le impide en absoluto utilizar efectos fijos para obtener predicciones más precisas a lo largo del tiempo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X