Antes de hacer esta pregunta, busqué en nuestro sitio y encontré muchas preguntas similares, (como aquí , aquí y aquí ). Pero siento que esas preguntas relacionadas no fueron bien respondidas o discutidas, por lo que me gustaría plantear esta cuestión de nuevo. Creo que debe haber una gran cantidad de público que desea que este tipo de preguntas se expliquen con mayor claridad.
Para mis preguntas, primero considere el modelo lineal de efectos mixtos, $$ \mathbf{y = X\boldsymbol \beta + Z \boldsymbol \gamma + \boldsymbol \epsilon} $$ donde $X\boldsymbol \beta$ es el componente de efectos fijos lineales, $\mathbf{Z}$ es la matriz de diseño adicional correspondiente al parámetros de efectos aleatorios , $\boldsymbol \gamma$ . Y $\boldsymbol \epsilon \ \sim \ N(\mathbf{0, \sigma^2 I})$ es el término de error habitual.
Supongamos que el único factor de efecto fijo es una variable categórica Tratamiento con 3 niveles diferentes. Y el único factor de efecto aleatorio es la variable Asunto . Dicho esto, tenemos un modelo de efectos mixtos con efecto de tratamiento fijo y efecto de sujeto aleatorio.
Mis preguntas son, pues, las siguientes
- ¿Existe el supuesto de homogeneidad de la varianza en el marco de un modelo lineal mixto, análogo a los modelos tradicionales de regresión lineal? En caso afirmativo, ¿qué significa específicamente este supuesto en el contexto del problema del modelo lineal mixto mencionado anteriormente? ¿Cuáles son otros supuestos importantes que deben evaluarse?
Mis pensamientos: SÍ. Los supuestos (media de error cero y varianza igual) siguen siendo de aquí: $\boldsymbol \epsilon \ \sim \ N(\mathbf{0, \sigma^2 I})$ . En el marco del modelo de regresión lineal tradicional, podemos decir que el supuesto es que "la varianza de los errores (o simplemente la varianza de la variable dependiente) es constante en los 3 niveles de tratamiento". Pero no sé cómo explicar este supuesto en el marco del modelo mixto. ¿Debemos decir que "las varianzas son constantes en los 3 niveles de tratamiento, condicionando a los sujetos? o no"?
-
El documento en línea de SAS sobre los diagnósticos de residuos e influencia ha sacado a relucir dos residuos diferentes, es decir, el Residuos marginales , $$ \mathbf{r_m = Y - X \hat{\boldsymbol \beta}} $$ y el Residuos condicionales , $$ \mathbf{r_c = Y - X \hat{\boldsymbol \beta} - Z \hat{\boldsymbol \gamma} = r_m - Z \hat{\boldsymbol \gamma}} .$$ Mi pregunta es, ¿para qué se utilizan los dos residuos? ¿Cómo podríamos utilizarlos para comprobar el supuesto de homogeneidad? Para mí, sólo los residuos marginales se pueden utilizar para abordar la cuestión de la homogeneidad, ya que corresponde a la $\boldsymbol \epsilon$ del modelo. ¿Es correcto lo que he entendido?
-
¿Se ha propuesto alguna prueba para comprobar el supuesto de homogeneidad en un modelo lineal mixto? @Kam señaló el prueba de levene previamente, ¿sería este el camino correcto? Si no es así, ¿cuáles son las indicaciones? Creo que después de ajustar el modelo mixto, podemos obtener los residuos, y tal vez puede hacer algunas pruebas (como la prueba de bondad de ajuste?), pero no estoy seguro de cómo sería.
-
También me di cuenta de que hay tres tipos de residuos de Proc Mixed en SAS, a saber el residuo en bruto , el residuo estudiado y el residuo de Pearson . Puedo entender las diferencias entre ellos en términos de fórmulas. Pero a mí me parecen muy similares cuando se trata de gráficos de datos reales. Entonces, ¿cómo deben utilizarse en la práctica? ¿Hay situaciones en las que se prefiere un tipo a otro?
-
Para un ejemplo de datos reales, los siguientes dos gráficos de residuos provienen de Proc Mixed en SAS. ¿Cómo se puede abordar con ellos el supuesto de la homogeneidad de las varianzas?
[Sé que tengo un par de preguntas aquí. Si puedes proporcionarme alguna de tus ideas a cualquier pregunta, es genial. No es necesario que las respondas todas si no puedes. Realmente deseo discutir sobre ellos para obtener una comprensión completa. Gracias]
Aquí están los gráficos de residuos marginales (crudos).
Aquí están los gráficos de residuos condicionales (crudos).
0 votos
Grandes preguntas - una posible respuesta a su número 2 se puede encontrar aquí comp.soft-sys.sas.narkive.com/7Qmrgufe/