Pero, técnicamente, se pueden imaginar muchas formas de agrupar los datos aunque la intención no sea un diseño de medidas bloqueadas o repetidas.
Es cierto, pero la cuestión no es el bloqueo o las medidas repetidas, sino la no independencia de las observaciones dentro de los grupos. Si hay no independencia, hay que tenerla en cuenta para poder hacer inferencias válidas. Los interceptos aleatorios o los efectos fijos para la variable de agrupación pueden hacerlo. Si las observaciones son independientes, debería ser seguro excluir los efectos aleatorios, y los efectos fijos tampoco serán necesarios.
Pero si hay es no independencia, entonces obviamente con muchos grupos es preferible ajustar interceptos aleatorios, mientras que si hay muy pocos entonces los interceptos aleatorios no son apropiados. No hay forma de trazar la línea sobre cuántos grupos son necesarios. Hay cierto consenso en torno a 6, pero también hay cierto desacuerdo al respecto.
El ejemplo de su pregunta:
Si se midiera a todos los colegios de la provincia con alguna métrica media, pero no se tuviera en el conjunto de datos alguna variable geográfica para delimitar dónde están esos colegios, ¿habría que preocuparse por esto?
Así que, para generalizar, está hablando de la ausencia de variables a nivel de grupo. Un modelo de efectos mixtos/multinivel sigue estando justificado en tales circunstancias. Incluso un modelo de componentes de la varianza (sin efectos fijos de ningún tipo) puede ser un modelo útil.
Otra situación en la que los efectos aleatorios no están justificados es cuando se necesitan estimaciones marginales, en lugar de condicionales, en un contexto de MLG. En este caso, las ecuaciones de estimación generalizada (GEE) son las más adecuadas.
Además, también diría que las pendientes aleatorias requieren cierto cuidado. Ha habido una explosión en el uso de modelos "máximos" en los que se ajustan las pendientes aleatorias para todos los efectos fijos. Esto a menudo conduce a un sobreajuste y a un modelo singular. Este sitio contiene muchas preguntas en las que los investigadores han encontrado modelos singulares debido al sobreajuste de la estructura aleatoria. Algunos detalles más sobre esto están aquí:
¿Debo eliminar las correlaciones entre los efectos aleatorios antes de eliminar algunos de ellos?
Este último punto es bastante interesante, porque a menudo podemos razonar que TODOS Los efectos fijos pueden variar según el sujeto: en la investigación médica, por ejemplo, ¿por qué esperar que la respuesta de un sujeto sea exactamente la misma que la de todos los demás? Obviamente, es razonable esperar que varíen, así que ¿por qué no ajustar pendientes aleatorias para todo? La razón es que a menudo no hay datos suficientes para apoyar esto, y eso es lo que lleva a modelos singulares. Hay más información sobre esto aquí:
Cómo tratar el ajuste singular en los modelos mixtos
Cómo simplificar una estructura aleatoria singular cuando las correlaciones declaradas no están cerca de +1/-1
Por último, hay algunos ámbitos en los que los investigadores desconfían totalmente de los efectos aleatorios. Los economistas se preocupan por la "exogeneidad de nivel superior", que tiene que ver con la suposición de efectos aleatorios distribuidos normalmente y la posible correlación entre los efectos aleatorios y la variación residual. En mi propio trabajo no he encontrado que esto sea un gran problema. También es un artefacto del software: muchos paquetes populares para el ajuste de modelos multinivel y de efectos mixtos hacen estas suposiciones por eficiencia computacional. Pero si adoptamos un enfoque bayesiano, creo que estos problemas pueden superarse (al menos en parte).
1 votos
En sentido estricto, la línea está trazada por nuestra pregunta de investigación. Pero, ¿responde esto a su pregunta? ¿Cuál es la diferencia entre los modelos de efecto fijo, efecto aleatorio y efecto mixto?
1 votos
Aunque nuestras preguntas coinciden en parte, mi pregunta no está tan relacionada con qué sus diferencias son tanto como cuando alguien consideraría innecesaria la inclusión de un efecto aleatorio.