Yo soy el ajuste de un modelo de efectos aleatorios con glmer
a algunos datos de negocio. El objetivo es analizar el rendimiento de ventas por distribuidor, teniendo en cuenta la variación regional. Tengo las siguientes variables:
-
distcode
: ID de distribuidor, con alrededor de 800 niveles -
region
: de nivel superior geográfico ID (norte, sur, este, oeste) -
zone
: nivel medio de geografía anidada dentro deregion
, alrededor de 30 niveles y en todos los -
territory
: bajo nivel geografía anidada dentro dezone
, alrededor de 150 niveles
Cada distribuidor opera sólo en un territorio. La parte difícil es que esto es un resumen de los datos, con un punto de datos por el distribuidor. Así que tengo 800 puntos de datos y estoy tratando de ajuste (por lo menos) 800 parámetros aunque en la regularización de la moda.
He ajustado un modelo como el siguiente:
glmer(ninv ~ 1 + (1|region/zone/territory) + (1|distcode), family=poisson)
Este se ejecuta sin problema, aunque sí la impresión de una nota:
Número de niveles de una agrupación para el factor de efectos aleatorios es igual a n, el número de observaciones
Es esta una cosa sensata que hacer? Puedo obtener finito estimaciones de todos los coeficientes, y el AIC también no es irrazonable. Si trato de poisson GLMM con la identidad de enlace, la AIC es mucho peor para el registro de enlace es al menos un buen punto de partida.
Si me graficar los valores ajustados vs la respuesta, me pongo lo que es esencialmente un ajuste perfecto, que supongo que es porque tengo un punto de datos por el distribuidor. Es que razonable, o estoy haciendo algo completamente tonta?
Este es el uso de datos para un mes. Me pueden obtener datos para varios meses y obtener algunos de replicación de esa manera, pero me gustaría tener la adición de nuevos términos por mes-a-mes, variación y las posibles interacciones medicamentosas, ¿correcto?
ETA: me encontré con el modelo anterior de nuevo, pero sin un family
argumento (por lo que sólo una gaussiana LMM en lugar de un GLMM). Ahora lmer
me dio el siguiente error:
Error en (function (fr, FL, inicio, REML, detallado) : Número de niveles de una agrupación para el factor de efectos aleatorios debe ser menor que el número de observaciones
Así que supongo que no estoy haciendo algo razonable, como el cambio de la familia no debería tener un efecto. Pero ahora la pregunta es, ¿por qué el trabajo en el primer lugar?