5 votos

Cómo construir un lineal de efectos mixtos en el modelo de R?

Yo les hice una pregunta, pero era un poco largo y confuso, así que lo voy a intentar mantener este corto y simple (post original de efectos Mixtos modelo de ecuaciones)

Yo soy básicamente mirando para ver qué factores (por ejemplo, a, B, C, tales como el tipo de hábitat, el sitio, la alteración de la tasa) la mayoría de afectar el valor de respuesta (y). Por fin estoy entendiendo el concepto de modelos y cómo comparar los valores de AIC para ver qué combinación de factores que mejor explican y (tienen mayor efecto), pero soy nuevo en R por lo que pregunto si mis básicos de codificación es correcta.

En primer lugar tengo todos mis datos en una hoja de guarda como un .archivo csv, por lo que he leído de este archivo en R. también he abierto el paquete lme4.

Entonces yo estaba pensando en usar el siguiente código (aunque las cartas serían los encabezamientos de las fo de cada conjunto de valores)

m1<-lmer(y ~ A + (1|E), REML=FALSE)
m2<-lmer(y ~ B + (1|E), REML=FALSE)
m3<-lmer(y ~ A + B + (1|E), REML=FALSE)
m4<-lmer(y ~ A + C + (1|E), REML=FALSE)
m5<-lmer(y ~ B + C + (1|E), REML=FALSE)
m6<-lmer(y ~ A + B + C + (1|E), REML=FALSE)
m4<-lmer(y ~ A + D + (1|E), REML=FALSE)
m5<-lmer(y ~ B + D + (1|E), REML=FALSE)
m6<-lmer(y ~ A + B + D + (1|E), REML=FALSE)
m7<-lmer(y ~ C + (1|E), REML=FALSE)
m8<-lmer(y ~ D + (1|E), REML=FALSE)

Mis preguntas básicas son:

  1. Digamos que C y D son factores similares, y derivados de los mismos datos y no creo que sea útil para ver si tienen efectos aditivos, es bueno no poner en el mismo modelo, es decir, mezclar y combinar como parezca, o debe todas las combinaciones de ser incorporados?

  2. Elegí ML debido a que no todos los conjuntos de valores son mezclados y emparejados. Es esto correcto o debo usar REML?

  3. Algunos conjuntos de valores no son continuas, por ejemplo, la cría número o tipo de hábitat (1 o 2). Debo estar dejando R saber esto. Alguien mencionó la codificación de cada factor, pero no tengo ni idea de cómo hacer esto, o es el archivo csv suficiente y, a continuación, quizás código para comunicar a R saber acerca de estos particulares?

  4. Por último, es también una manera de ver los valores de p para ver si el factor tiene un efecto significativo en lugar de ser simplemente el mejor ajuste para explicar y?

Espero que esto es más sencillo de lo que mi primer post y más fácil de contestar a todos a la vez. Yo realmente quería correr este modelo hoy en día, pero no quiero tener que rehacer todo hallazgo que he hecho un simple error.

3voto

bheklilr Puntos 113
  1. Es totalmente de usted en cuanto a si se incluyen tanto factores en el mismo modelo o no. Pero, ¿por qué no intentarlo y ver si usted consigue un ajuste significativamente mejor con ambos en que con sólo uno?

  2. REML trabaja con desequilibrado e incompleta diseños demasiado. Me gustaría ir con REML para reducir el sesgo en las estimaciones de la variación y eliminar el sesgo en la covarianza de los parámetros.

  3. x <- as.factor(z) vueltas z en un factor. Por supuesto que puedes hacerlo DF$x <- as.factor(DF$x).

  4. anova(m1, m3) pondrá a prueba para el significado de los términos a la izquierda de la modelo más grande. Los modelos anidados para que esto funcione.

Edit: Los comentarios que me han hecho darme cuenta de mi respuesta era demasiado concisa, lo voy a agregar algo de código de ejemplo.

El código no está haciendo el modelo completo que usted está haciendo, es sólo para ilustrar la sintaxis y de lo que sucede con ANOVA:

# Construct sample data; E(y) is a function only of x1
x1 <- c("A","A","A","B","B","C","D","D","D","D")
x2 <- c("A","B","C","A","B","C","A","B","C","A")
y <- rnorm(c(0,0,0,1,1,2,3,3,3,3))  # Values for E(y) match w/ x1

# Construct data frame
df <- data.frame(list(y=y, x1=x1, x2=x2))

# Convert x1, x2 to factors
df$x1 <- as.factor(df$x1)
df$x2 <- as.factor(df$x2)

# Run regressions and perform ANOVA to evaluate effect of factor x2
m1 <- lm(y~x1, data=df)
m2 <- lm(y~x1+x2, data=df)

> anova(m1,m2)
Analysis of Variance Table

Model 1: y ~ x1
Model 2: y ~ x1 + x2
  Res.Df     RSS Df Sum of Sq     F Pr(>F)
1      6 12.9004                          
2      4  5.3241  2    7.5763 2.846 0.1703

El "PR(>F) en la columna" da el p-valor asociado a la prueba F de si el factor de x2 es significativo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X