Busco opiniones/interpretaciones sobre un modelo que estoy tratando de encajar. Un descargo de responsabilidad: soy ecologista y no estadístico; ¡y agradezco el tiempo y las opiniones de todos! En general, estoy siguiendo las recomendaciones de Zuur et al. 2009 (usando R) en un intento de modelar la velocidad de desplazamiento como una función de algunas covariables ambientales, siendo la principal de interés una variable de "tratamiento" 1/0.
Los datos son, por naturaleza, jerárquicos, por lo que he utilizado un modelo mixto con un intercepto aleatorio. El modelo mixto se ajusta significativamente mejor que el modelo base gls
modelo. Además, he incluido un varIdent
con el modelo mixto, y que es significativamente mejor que sin él.
A partir de este punto, he mirado los supuestos y los diagnósticos - los residuos parecen estar bien, creo, pero siempre me cuesta decir si es "demasiado" patrón. Creo que menos del 5% de los datos están fuera de la 2/-2, así que estoy bien allí. La variación no parece estar impulsada por ningún punto en particular, y la varianza de los residuos para cada grupo del "tratamiento" es cercana a 1 (usando tapply
(lo interpreto como una heterogeneidad menor). Un gráfico de caja de los residuos por el efecto aleatorio muestra una dispersión igual en torno a cero y una variación menor = independencia (véase más abajo)
He mirado los residuos frente al ajuste (no está mal), los residuos frente a cada covariable (patrón con una de mis covariables, la elevación), el histograma de los residuos (todavía bastante sesgado), y he comprobado todas las posibles observaciones influyentes.
No sé si he "terminado" y puedo considerar que este modelo se ajusta a la realidad.
He incluido un par de imágenes de diagnóstico (la variable de respuesta no puede estar por debajo de un determinado valor y, por tanto, el gráfico de residuos muestra una "línea" nítida en los valores negativos) - residuos estándar frente a los ajustados; residuos por intercepción aleatoria; histograma de residuos (no normalizados); residuos por covariable de elevación - podría estar pasando algo aquí, pero no estoy seguro de cómo tratarlo: