14 votos

¿Por qué es difícil incorporar la incertidumbre en los efectos aleatorios cuando se hacen predicciones de los modelos mixtos?

Hay varios hilos en R-sig-ME sobre la obtención de intervalos de confianza para las predicciones usando lme4 y nlme en R. Por ejemplo aquí y aquí en el 2010, incluyendo algunos comentarios por Dougals Bates, uno de los autores de ambos paquetes. No me atrevo a citarlo textualmente, por temor a ser tomado fuera de contexto, pero de todos modos, uno de los comentarios que él hace es

"Ustedes son la combinación de parámetros y variables aleatorias en sus predicciones y no estoy seguro de lo que esto significaría para evaluar la variabilidad de los las predicciones. Un Bayesiano puede ser capaz de hacer sentido de ella, pero yo no puedo conseguir mi cabeza alrededor de ella." https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html

Sé que el Bayesiano glmm paquete MCMCglmm puede producir intervalos de credibilidad para las predicciones.

Últimamente, la versión de desarrollo de la lme4 en github se ha dado un predict método, sino que está acompañada del siguiente comentario:

"@nota: no Hay ninguna opción para calcular los errores estándar de predicciones debido a que es difícil definir un método eficiente que incorpora la incertidumbre en los parámetros de varianza; recomendamos \code{\link{bootMer}} para esta tarea." https://github.com/lme4/lme4/blob/master/R/predict.R

Así que, ¿por qué es difícil incorporar la incertidumbre en los efectos aleatorios cuando hacer predicciones a partir de modelos mixtos en un frecuentista de configuración ?

8voto

No estoy seguro acerca de predecir el método de comentario pero el principal problema está relacionado con la generación fácilmente interpretables varianza de medidas, no de varianza de medidas de por sí. Bates no está comentando en la primera cita si usted puede hacerlo, lo que significa.

Tomar un simple modelo multinivel de dos niveles del diseño de medidas repetidas. Digamos que usted tiene los siguientes datos en la que cada línea es un asunto:

enter image description here

En lmer el modelo puede ser expresado como:

y ~ x + (1|subject)

Estás predecir el valor de y a partir de x como un efecto fijo (diferencia entre a y B); y la intersección de un efecto aleatorio**. Mire cuidadosamente la gráfica y tenga en cuenta que mientras que hay variabilidad en la x efecto para cada sujeto (de cada línea de pendiente) es relativamente pequeño en comparación con la variabilidad entre los sujetos (la altura de cada línea).

El modelo analiza estos dos conjuntos de variabilidad y cada uno es significativo. Usted puede utilizar el de efectos aleatorios para predecir las alturas de las líneas y puede utilizar efectos fijos de x para predecir pendientes. Usted puede incluso utilizar los dos combinados para el trabajo de nuestros valores. Pero lo que no puedes hacer es decir algo significativo con respecto a su modelo cuando se combinan la variabilidad de las pendientes y alturas de las líneas a la vez. Usted necesita hablar acerca de la variabilidad de sus laderas y las cimas de las líneas por separado. Esa es una característica del modelo, no un pasivo.

Usted tendrá una variabilidad del efecto de x que es relativamente fácil de calcular. Usted podría decir algo acerca de un intervalo de confianza alrededor de eso. Pero tenga en cuenta que, en este intervalo de confianza va a tener una pequeña relación a la predicción de un determinado valor y porque el valor de y es influenciado por una combinación de efecto y objeto de la varianza que es diferente de la variabilidad del efecto solo.

Cuando Bates escribe cosas como las que has citado me imagino que a menudo pensaba mucho más complejo multi-nivel de los diseños que esto no se acercan. Pero incluso si usted acaba de considerar este simple ejemplo que vengan a preguntarse qué tipo de significado real puede ser extraído de la combinación de la totalidad de la varianza de medidas en conjunto.

** He ignorado el efecto fijo de la intersección de la simplicidad y sólo lo tratan como un efecto aleatorio. Se podrían extraer conclusiones similares a partir de una aún más sencillo modelo con una muestra aleatoria y se fija interceptar sólo, pero creo que sería más difícil de transmitir. En ese caso, de nuevo, el de efectos fijos y de efectos aleatorios son analizados por una razón y significar diferentes cosas y poniendo su variabilidad por los valores de la predicción de las causas que la variabilidad hacer poco sentido con respecto al modelo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X