He aquí un ejemplo en el que un modelo multinivel podría ser "esencial". Supongamos que se quiere calificar la "calidad" de la educación impartida por un conjunto de escuelas utilizando los resultados de los exámenes de los alumnos. Una forma de definir la calidad de la escuela es en términos de rendimiento medio en los exámenes después de tener en cuenta las características de los estudiantes. Esto se podría conceptualizar como, yis=αs+X′isβs+ϵis, donde yis es la puntuación de la prueba continua del alumno i en la escuela s , Xis son atributos de los estudiantes centrados en los medios escolares, βs es un coeficiente específico de la escuela sobre estos atributos, αs es un "efecto escuela" que mide la calidad escolar, y ϵis son las idiosincrasias de los estudiantes en su rendimiento en los exámenes. El interés aquí se centra en estimar la αs que miden el "valor añadido" que la escuela proporciona a los estudiantes una vez que se tienen en cuenta sus atributos. Se quiere tener en cuenta los atributos de los alumnos, porque no se quiere castigar a una buena escuela que tiene que atender a alumnos con ciertas desventajas, con lo que se deprimen los resultados medios de los exámenes a pesar del alto "valor añadido" que la escuela proporciona a sus alumnos.
Con el modelo en la mano, la cuestión se convierte en una estimación. Si tiene muchas escuelas y muchos datos para cada escuela, las buenas propiedades de OLS (véase Angrist y Pischke, Mayormente inofensivo... para una revisión actual) sugieren que se quiera usar eso, con ajustes adecuados a los errores estándar para tener en cuenta las dependencias, y usando variables ficticias e interacciones para obtener los efectos a nivel de escuela y los interceptos específicos de la escuela. OLS puede ser ineficiente, pero es tan transparente que podría ser más fácil convencer a las audiencias escépticas si se utiliza. Pero si sus datos son escasos en ciertos aspectos -en particular si tiene pocas observaciones para algunas escuelas- puede querer imponer más "estructura" al problema. Puede querer "tomar prestada la fuerza" de las escuelas de la muestra más grande para mejorar las estimaciones ruidosas que obtendría en las escuelas de la muestra pequeña si la estimación se hiciera sin estructura. Entonces, podría recurrir a un modelo de efectos aleatorios estimado a través de FGLS, o tal vez una aproximación a la verosimilitud directa dado un determinado modelo paramétrico, o incluso Bayes en un modelo paramétrico.
En este ejemplo, el uso de un modelo multinivel (independientemente de cómo decidamos ajustarlo, en última instancia) está motivado por el interés directo en los interceptos a nivel de escuela. Por supuesto, en otras situaciones, estos parámetros a nivel de grupo pueden no ser más que una molestia. La necesidad o no de ajustarlos (y, por tanto, de seguir trabajando con algún tipo de modelo multinivel) depende de si se cumplen ciertos supuestos de exogeneidad condicional. A este respecto, recomendaría consultar la literatura econométrica sobre los métodos de datos de panel; la mayoría de las ideas de allí se trasladan a contextos generales de datos agrupados.
4 votos
Véase también: stats.stackexchange.com/a/38430/5739