Supongamos que tengo pseudo-datos, donde se incluyen tres temas y sus tomada analgésico dosis y sentí el dolor en los respectivos cuatro ensayos: (los números no hacen sentido médico, pero quiero que el caso extremo)
library(ggplot2)
library(lme4)
set.seed(1337)
x1 <- 1:4
y1 <- 100 + (rnorm(4) - 8 * x1)
x2 <- 26:29
y2 <- 500 + (rnorm(4) - 7 * x2)
x3 <- 51:54
y3 <- 1000 + (rnorm(4) - 10 * x3)
df_test <- data.frame(subject_id = factor(rep(c(1,2,3), each = 4)),
dosage = c(x1, x2, x3),
pain = round(c(y1, y2, y3), 1))
df_test
## subject_id dosage pain
## 1 1 1 92.2
## 2 1 2 82.6
## 3 1 3 75.7
## 4 1 4 69.6
## 5 2 26 317.3
## 6 2 27 313.0
## 7 2 28 304.9
## 8 2 29 299.1
## 9 3 51 491.9
## 10 3 52 479.6
## 11 3 53 471.0
## 12 3 54 458.3
Puesto que cada sujeto se repitió medido, me gustaría saber,"la relación entre la toma de la dosis y sentí el dolor" por la creación de un modelo mixto donde el sujeto es la agrupación factor de efectos aleatorios.
Dos modelos que he intentado se enumeran a continuación:
Modelo 1:
summary(lmer(pain ~ dosage + (1 | subject_id), data = df_test))
## Linear mixed model fit by REML ['lmerMod']
## Formula: pain ~ dosage + (1 | subject_id)
## Data: df_test
##
## REML criterion at convergence: 77.4
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -1.60297 -0.19477 0.04491 0.25937 1.53768
##
## Random effects:
## Groups Name Variance Std.Dev.
## subject_id (Intercept) 161876.29 402.339
## Residual 8.45 2.907
## Number of obs: 12, groups: subject_id, 3
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 512.2454 233.2030 2.197
## dosage -8.1568 0.7489 -10.891
##
## Correlation of Fixed Effects:
## (Intr)
## dosage -0.088
Modelo 2:
summary(lmer(pain ~ dosage + (1+dosage | subject_id), data = df_test))
## Linear mixed model fit by REML ['lmerMod']
## Formula: pain ~ dosage + (1 + dosage | subject_id)
## Data: df_test
##
## REML criterion at convergence: 101.3
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -1.34815 -0.60873 -0.01502 0.61189 1.36244
##
## Random effects:
## Groups Name Variance Std.Dev. Corr
## subject_id (Intercept) 2526.259 50.262
## dosage 1.381 1.175 -1.00
## Residual 402.622 20.065
## Number of obs: 12, groups: subject_id, 3
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 99.4286 34.2614 2.902
## dosage 7.2037 0.7812 9.221
##
## Correlation of Fixed Effects:
## (Intr)
## dosage -0.939
He leído las Preguntas acerca de cómo los efectos aleatorios son especificados en lmer. Mi comprensión es que, el Modelo 1 significa que cada sujeto tiene su propia intersección de un dolor o de la dosis, mientras que el Modelo 2, además, permite que cada sujeto tiene su propia pendiente de un dolor o de la dosis. Estoy en lo cierto?
Sin embargo, todavía estoy sorprendido por la enorme diferencia entre los coeficientes de la dosis de efectos fijos (-8.1568 en el Modelo 1 y 7.2037 en el Modelo 2). Yo pensaba que el Modelo 2 es el más adecuado para mi pregunta ya que los sujetos pueden tener varias reacciones a la droga, pero el coeficiente positivo es contradictorio con la tendencia de cada respectivo tema, haciendo la interpretación más razonable.
¿Cómo debo elegir el "correcto" modelo? Y ¿cómo es que los resultados son tan diferentes entre estos dos modelos - ¿cuáles son las razones matemáticas?