La fórmula que hay que especificar para entrenar un modelo multinivel (utilizando lmer
de lme4
R
biblioteca) siempre me atrapa. He leído innumerables libros de texto y tutoriales, pero nunca lo he entendido bien.
He aquí un ejemplo de este tutorial que me gustaría ver formulado en una ecuación. Estamos intentando modelar la frecuencia de la voz en función del sexo (las mujeres tienen un tono de voz más agudo que los hombres en general) y de la actitud de la persona (si ha contestado de manera educada o informal) en diferentes escenarios. Además, como puede verse en el subject
columna, cada persona fue sometida a mediciones varias veces.
> head(politeness, n=20)
subject gender scenario attitude frequency
1 F1 F 1 pol 213.3
2 F1 F 1 inf 204.5
3 F1 F 2 pol 285.1
4 F1 F 2 inf 259.7
5 F1 F 3 pol 203.9
6 F1 F 3 inf 286.9
7 F1 F 4 pol 250.8
8 F1 F 4 inf 276.8
9 F1 F 5 pol 231.9
10 F1 F 5 inf 252.4
11 F1 F 6 pol 181.2
12 F1 F 6 inf 230.7
13 F1 F 7 inf 216.5
14 F1 F 7 pol 154.8
15 F3 F 1 pol 229.7
16 F3 F 1 inf 237.3
17 F3 F 2 pol 236.8
18 F3 F 2 inf 251.0
19 F3 F 3 pol 267.0
20 F3 F 3 inf 266.0
subject
, gender
y attitude
son factores (con informal
y female
considerados como niveles de base para attitude
y gender
en las ecuaciones siguientes). Ahora, una idea es entrenar un modelo con diferentes interceptos para cada subject
y scenario
:
politeness.model=lmer(frequency ~ attitude + gender +
(1|subject) + (1|scenario), data=politeness)
Si mi comprensión de la notación es correcta, esto corresponde a:
$y_i=a^1_{j[i]}+a^2_{k[i]}+\beta\cdot$ attitude
$_{\text{pol}_i} + \gamma\cdot$ gender
$_{\text{male}_i}$
donde $i$ indica $i^{th}$ punto de datos, $j[i]$ denota el nivel de grupo para subject
y $k[i]$ denota el nivel de grupo para scenario
para $i^{th}$ punto de datos. attitude
$_\text{pol}$ y gender
$_\text{male}$ son indicadores binarios.
Para introducir pendientes aleatorias para la actitud, podemos escribir:
politeness.model = lmer(frequency ~ attitude + gender +
(1+attitude|subject) + (1+attitude|scenario), data=politeness)
De nuevo, si mi comprensión es clara, esto corresponde a:
$y_i = a^1_{j[i]} + a^2_{k[i]} + (\beta^1_{j[i]} + \beta^2_{k[i]})\cdot$ attitude
$_{\text{pol}_i} + \gamma\cdot$ gender
$_{\text{male}_i}$
Ahora bien, ¿qué ecuación R
corresponde?
politeness.null = lmer(frequency ~ gender +
(1+attitude|subject) + (1+attitude|scenario), data=politeness)