14 votos

¿Qué sería de un intervalo de confianza alrededor de un valor de predicción de un modelo de efectos mixtos decir?

Yo estaba buscando en esta página y he notado los métodos de intervalos de confianza para la lme y lmer en R. Para aquellos que no conocen a R, esas son las funciones para la generación de efectos mixtos o multi-nivel de los modelos. Si he de efectos fijos en algo así como un diseño de medidas repetidas ¿qué sería de un intervalo de confianza alrededor del valor predicho (similar a la media) significa? Puedo entender que para que un efecto puede tener una razonable intervalo de confianza, pero me parece que es un intervalo de confianza alrededor de una predicción de la media en este tipo de diseños parece ser imposible. Esto podría ser muy grande para reconocer el hecho de que la variable aleatoria contribuye a la incertidumbre en la estimación, pero en ese caso no sería útil en un sentido inferencial a través de la comparación de los valores. O, tendría que ser lo suficientemente pequeño para uso por inferencia, pero inútil como una estimación de la calidad de la media (predicho) el valor que usted podría encontrar en la población.

Me estoy perdiendo algo aquí, o es mi análisis de la situación correcta?... [y, probablemente, una justificación de por qué no se implementa en lmer (pero fácil de conseguir en SAS). :)]

7voto

Noam Gal Puntos 155

Tiene el mismo significado como en cualquier otro intervalo de confianza: bajo el supuesto de que el modelo es correcto, si el experimento y el procedimiento se repite una y otra vez, el 95% del tiempo el valor verdadero de la cantidad de interés se encuentran en el intervalo. En este caso, la cantidad de interés es el valor esperado de la variable de respuesta.

Probablemente es más fácil explicar esto en el contexto de un modelo lineal (modelos mixtos son sólo una extensión de este, por lo que las mismas ideas se aplican):

La habitual suposición es que:

$y_i = X_{i1} \beta_1 + X_{i2} \beta_2 + \ldots X_{ip} \beta_p + \epsilon $

donde $y_i$ es la respuesta, $X_{ij}$'s son las covariables, $\beta_j$'s son los parámetros, y $\epsilon$ es el término de error que tiene una media de cero. La cantidad de interés es entonces:

$E[y_i] = X_{i1} \beta_1 + X_{i2} \beta_2 + \ldots X_{ip} \beta_p $

que es una función lineal de la (desconocida) de parámetros, ya que las covariables son conocidos (y fijo). Ya sabemos que la distribución de muestreo de la vector de parámetros, podemos calcular fácilmente la distribución de muestreo (y, por tanto, el intervalo de confianza) de esta cantidad.

Entonces, ¿por qué te gustaría saber? Supongo que si usted está haciendo fuera de la muestra de predicción, se podría decir cómo de buena es tu pronóstico se espera que sea (aunque tendría que tomar en cuenta la incertidumbre del modelo).

1voto

Ηλίας Puntos 109

Tal vez esto tiene sentido en el marco Bayesiano. Considere por ejemplo el one-way ANOVA de efectos aleatorios modelo : $$(y_{ij} | \mu_i) \sim {\cal N}(\mu_i, \sigma^2_w), \quad \mu_i \sim {\cal N}(\mu, \sigma_b^2),$$ y antes de la distribución de la media global de la $\mu$ y el de componentes de varianza $\sigma^2_w$$\sigma^2_b$. A continuación, cada una de las $\mu_i$ tiene una distribución posterior, y un $95\%$ dispersión del intervalo de esta distribución podría jugar el papel de un $95\%$ "confianza" intervalo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X