En un primer nivel, creo que todo lo que estás ignorando contracción hacia los valores de la población; " las pendientes e interceptos por sujeto del modelo de efectos mixtos se acercan más a las estimaciones de población que las estimaciones por mínimos cuadrados dentro del sujeto. " [ref. 1]. El siguiente enlace probablemente también será de ayuda ( ¿Cuáles son los descriptivos adecuados para mis modelos mixtos? ), véase la respuesta de Mike Lawrence).
Además, creo que en tu ejemplo de juguete tienes un poco de mala suerte porque tienes un diseño perfectamente equilibrado que hace que tengas exactamente la misma estimación en el caso de que no falten valores.
Pruebe el siguiente código que tiene el mismo proceso con ningún valor que falta ahora:
cat <- as.factor(sample(1:5, n*k, replace=T) ) #This should be a bit unbalanced.
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits= 7,fixef(m3)) == round(digits=7, coef(m1)) #Not this time lad.
#(Intercept) x
# FALSE FALSE
Donde ahora, debido a que tu diseño no está perfectamente equilibrado no tienes las mismas estimaciones de coeficientes.
En realidad si juegas con tu patrón de valores perdidos de una manera tonta ( así por ejemplo: y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
) para que tu diseño siga estando perfectamente equilibrado volverás a obtener los mismos coeficientes.
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data in a perfectly balanced way
y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits=7,fixef(m3)) == round(digits=7, coef(m1)) #Look what happend now...
#(Intercept) x
# TRUE TRUE
Estás marginalmente equivocado por el perfecto diseño de tu experimento original. Al insertar los NA de forma no equilibrada, cambiaste el patrón de cuánta "fuerza" podían tomar prestada cada uno de los sujetos.
En resumen, las diferencias que se observan se deben a efectos de contracción y, más concretamente, a que usted distorsionó su diseño original perfectamente equilibrado con valores perdidos no perfectamente equilibrados.
Ref 1: Douglas Bates lme4:Modelización de efectos mixtos con R páginas 71-72
0 votos
Supongo que quieres decir "de modelo
m3
es 0.0011713" en lugar dem2
.0 votos
Lo siento @user11852, sí tienes razón, gracias. (Por cierto, para
m2
también es válido (que es objeto de otra pregunta ).