3 votos

Modelización de efectos mixtos que incluye el factor con NA

Estoy analizando datos sobre el tiempo de reacción utilizando un modelo de efectos mixtos en R. Los datos proceden de dos tipos de grupos de participantes: hablantes nativos y no nativos. Para los no nativos, tengo las puntuaciones de competencia (estimando su dominio del inglés). La competencia de los hablantes nativos es irrelevante y se codifica como NA. ¿Significa esto que lmer considerará la competencia como un factor sólo para los hablantes no nativos?

'data.frame':   8373 obs. of  17 variables:
$Subject       : Factor w/ 21 levels 
$L1            : Factor w/ 3 levels "English","German",..: 
$Proficiency   : Factor w/ 12 levels:"0","0.6","0.61",..: 8 8 8 8 8 8 8 8 8 8 ...  
$Target        : Factor w/ 243 levels 
$Relation      : Factor w/ 4 levels 
$Word.Order    : Factor w/ 2 levels "HeadMod*","ModHead"
$Priming       : Factor w/ 2 levels "PrHead","PrMod"
$Trial         : Factor w/ 481 levels 
$Target.RTinv  : num

Me preocupa que cuando añado Proficiency a mi modelo, el AIC y el BIC se vuelven negativos. ¿Hay que preocuparse por esto?

Models:
dat.lmer5: -1000 * Target.RTinv ~ (1 | Subject) + (1 | Target) + L1 + Word.Order + Priming
dat.lmer8: -1000 * Target.RTinv ~ (1 | Subject) + (1 | Target) + L1 + Word.Order + Priming + Proficiency
          Df     AIC     BIC  logLik  Chisq Chi Df Pr(>Chisq)
dat.lmer5  8 1859.68 1915.92 -921.84
dat.lmer8 17 -438.62 -329.59  236.31 2316.3      9  < 2.2e-16 ***

2voto

Raptrex Puntos 115

Sólo utiliza los datos de los casos completos, por lo que los que tienen NA no se incluyen en absoluto en el segundo modelo. Esto hace que el AIC/BIC sea incomparable, ya que sólo tiene sentido utilizar el AIC/BIC para comparar modelos basados en los mismos datos.

Mira la salida de summary para confirmar, y para ver cuántas observaciones se incluyeron en cada modelo.

Sin embargo, el negativo no es un problema; el valor real tiene poco significado interpretable; lo que importa es lo diferentes que son los valores. Lo que importa es la diferencia entre los valores. Lo más pequeño siempre es mejor, así que si ambos son negativos, el valor más negativo es mejor.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X