3 votos

Modelo mixto de intercepción aleatoria en R - ¿se ajusta... ¿ES CORRECTO?

Busco opiniones/interpretaciones sobre un modelo que estoy tratando de encajar. Un descargo de responsabilidad: soy ecologista y no estadístico; ¡y agradezco el tiempo y las opiniones de todos! En general, estoy siguiendo las recomendaciones de Zuur et al. 2009 (usando R) en un intento de modelar la velocidad de desplazamiento como una función de algunas covariables ambientales, siendo la principal de interés una variable de "tratamiento" 1/0.

Los datos son, por naturaleza, jerárquicos, por lo que he utilizado un modelo mixto con un intercepto aleatorio. El modelo mixto se ajusta significativamente mejor que el modelo base gls modelo. Además, he incluido un varIdent con el modelo mixto, y que es significativamente mejor que sin él.

A partir de este punto, he mirado los supuestos y los diagnósticos - los residuos parecen estar bien, creo, pero siempre me cuesta decir si es "demasiado" patrón. Creo que menos del 5% de los datos están fuera de la 2/-2, así que estoy bien allí. La variación no parece estar impulsada por ningún punto en particular, y la varianza de los residuos para cada grupo del "tratamiento" es cercana a 1 (usando tapply (lo interpreto como una heterogeneidad menor). Un gráfico de caja de los residuos por el efecto aleatorio muestra una dispersión igual en torno a cero y una variación menor = independencia (véase más abajo)

He mirado los residuos frente al ajuste (no está mal), los residuos frente a cada covariable (patrón con una de mis covariables, la elevación), el histograma de los residuos (todavía bastante sesgado), y he comprobado todas las posibles observaciones influyentes.

No sé si he "terminado" y puedo considerar que este modelo se ajusta a la realidad.

He incluido un par de imágenes de diagnóstico (la variable de respuesta no puede estar por debajo de un determinado valor y, por tanto, el gráfico de residuos muestra una "línea" nítida en los valores negativos) - residuos estándar frente a los ajustados; residuos por intercepción aleatoria; histograma de residuos (no normalizados); residuos por covariable de elevación - podría estar pasando algo aquí, pero no estoy seguro de cómo tratarlo:

enter image description here

residuals by random intercept

histogram of residuals (not normalized)

resids by elevation covariate

1voto

Bruce ONeel Puntos 391

A partir del gráfico de residuos frente a los valores ajustados, parece que tus datos están acotados (esto también parece indicarse en los comentarios de la pregunta). Por lo tanto, un GLMM gamma sería una buena opción y hay muchos paquetes que pueden ajustar tales modelos, aparte de MCMCglmm

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X