1 votos

¿El "error estándar" proporcionado por lmer en lme4 es en realidad una desviación estándar?

He estado trabajando con lmer en lme4, y quería construir una curva de densidad de las pendientes producidas por mi modelo (en lugar de sólo intervalos de confianza). La salida del modelo de lmer produce una pendiente y algo denominado "error estándar". Si calculo la desviación estándar a partir del error estándar, la desviación estándar es mucho mayor de lo que habría esperado.

Investigué esto más a fondo utilizando confint para seleccionar 1000 intervalos de confianza aleatorios, y comparando las pendientes obtenidas con una rnorm utilizando tanto lo que calculé que sería la desviación estándar, como el error estándar dado por lmer. Como puede ver, el error estándar está mucho más cerca de las pendientes de los intervalos de confianza aleatorios que de la desviación estándar. ¿Estoy en lo cierto al pensar que lo que se denomina error estándar en la salida de lmer es, al menos para los fines de la distribución de densidad de las pendientes, la desviación estándar?

Algunos ejemplos de código:

library(lme4)

set.seed(123)

#generate random dataset
df <- data.frame(weight=(rnorm(10000, 1, 0.3)),
                 height=(rnorm(10000, 5, 6)),
                 species = rep(c("mudkip", "torchic", "treecko"), length.out = 10000)) 
# model

mod <- lmer(data=df, weight ~ height + (1|species), REML=F)

slope <- coef(summary(mod))[ , "Estimate"][2]
se <- coef(summary(mod))[ , "Std. Error"][2]

sd <- se * sqrt(10000)

# Randomly extract slopes for varying confidence intervals

slope_num <- 1
ci_slope <- c()
for(i in runif(1000)){
  ci <- confint(mod,method="Wald", level=i)
  lwr <- colnames(ci)[1]
  upr <- colnames(ci)[2]
  ci_slope_lwr <- ci["height", lwr]
  ci_slope_upr <- ci["height", upr]
  slope_num <- slope_num + 1
  ci_slope <- c(ci_slope, ci_slope_lwr, ci_slope_upr)
}

# Generate rnorms using Std. Error and calculated standard deviation

rnorm_se <- rnorm(1000, slope, se)
rnorm_sd <- rnorm(1000, slope, sd)

# Comparative plots

plot(density(rnorm_se), lwd=2)
lines(density(ci_slope), col="blue")
lines(density(rnorm_sd), col="red") # I can't construct a readable graph that can fit sd with anything else

Gráfico de rnorm utilizando 'Std. Error', rnorm utilizando desviación estándar, y densidad de pendientes a partir de intervalos de confianza aleatorios.

3voto

Shane Oliver Puntos 126

El "error típico" de un parámetro es el desviación típica de la distribución muestral del parámetro (por ejemplo wiki ). En otras palabras, teóricamente, si muestreáramos nuevos datos y volviéramos a realizar el análisis una y otra vez, acabaríamos con una distribución de parámetros de pendiente, y estándar error es una estimación de la norma desviación de esa distribución.

Donde creo que te confundes es en que cuando el parámetro en cuestión es la media muestral, existe una relación simple entre la desviación típica muestral y el error típico de la media (es decir, la desviación típica de la distribución muestral de la media estimada): $\text{SEM} = \frac{SD}{\sqrt{n}}$ . Esta relación no se aplica a las estimaciones de los parámetros de los modelos de regresión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X