41 votos

¿En qué condiciones se debe utilizar el análisis multinivel/jerárquico?

¿En qué condiciones se debería considerar la posibilidad de utilizar el análisis multinivel/jerárquico frente a los análisis más básicos/tradicionales (por ejemplo, ANOVA, regresión OLS, etc.)? ¿Existen situaciones en las que esto podría considerarse obligatorio? ¿Hay situaciones en las que el uso del análisis multinivel/jerárquico sea inapropiado? Por último, ¿cuáles son algunos buenos recursos para que los principiantes aprendan el análisis multinivel/jerárquico?

4 votos

25voto

Omar Kooheji Puntos 384

Cuando la estructura de sus datos es naturalmente jerárquica o anidada, la modelización multinivel es un buen candidato. En general, es un método para modelar las interacciones.

Un ejemplo natural es cuando sus datos provienen de una estructura organizada, como un país, un estado o un distrito, y desea examinar los efectos en esos niveles. Otro ejemplo en el que se puede ajustar una estructura de este tipo es el análisis longitudinal, en el que se tienen mediciones repetidas de muchos sujetos a lo largo del tiempo (por ejemplo, alguna respuesta biológica a una dosis de medicamento). Un nivel de su modelo asume una respuesta media de grupo para todos los sujetos a lo largo del tiempo. Otro nivel de su modelo permite entonces perturbaciones (efectos aleatorios) de la media del grupo, para modelar las diferencias individuales.

Un libro popular y bueno para empezar es el de Gelman Análisis de datos mediante modelos de regresión y multinivel/jerarquía .

3 votos

Secundo esta respuesta y sólo quiero añadir otra gran referencia sobre este tema: El texto Applied Longitudinal Data Analysis de Singer < gseacademic.harvard.edu/alda >. Aunque es específico del análisis longitudinal, da una buena visión general del MLM en general. También me pareció bueno y legible el Análisis Multinivel de Snidjers y Bosker < stat.gamma.rug.nl/multilevel.htm >. John Fox también proporciona una buena introducción a estos modelos en R aquí < cran.r-project.org/doc/contrib/Fox-Companion/ >.

0 votos

Gracias a todos por sus respuestas :) Como pregunta complementaria, ¿no se podría conceptualizar la mayoría de los datos como naturalmente jerárquicos/anidados? Por ejemplo, en la mayoría de los estudios psicológicos hay una serie de variables dependientes (cuestionarios, respuestas a estímulos, etc.) anidadas dentro de los individuos, que a su vez están anidadas dentro de dos o más grupos (asignados aleatoriamente o no). ¿Está de acuerdo en que esto representa una estructura de datos naturalmente jerárquica y/o anidada?

0 votos

Si alguno de los gurús de los multiniveles/jerarquías pudiera disponer de unos minutos le agradecería mucho que opinara sobre las cuestiones de análisis planteadas en otro post ( stats.stackexchange.com/questions/1799/ ). En concreto, ¿crees que los datos sobre la percepción del dolor expuestos en ese post se analizarían mejor con análisis jerárquicos que con análisis no jerárquicos? ¿O no supondría ninguna diferencia o incluso sería inapropiado? Gracias :D

20voto

Judioo Puntos 625

El Centro de Modelización Multinivel tiene algunos buenos tutoriales gratuitos en línea para la modelización multinivel, y tienen tutoriales de software para el ajuste de modelos tanto en su software MLwiN como en STATA.

Tomad esto como una herejía, porque no he leído más que un capítulo del libro, pero Hierarchical linear models: applications and data analysis methods de Stephen W. Raudenbush, Anthony S. Bryk es muy recomendable. También juré que había un libro sobre modelización multinivel utilizando el software R en la serie Springer Use R!, pero parece que no puedo encontrarlo en este momento (pensé que estaba escrito por la misma gente que escribió el libro A Beginner's Guide to R).

edit: El libro sobre el uso de R para modelos multinivel es Mixed Effects Models and Extensions in Ecology with R por Zuur, A.F., Ieno, E.N., Walker, N., Saveliev, A.A., Smith, G.M.

buena suerte

10voto

bdonlan Puntos 508

He aquí otra perspectiva sobre el uso de los modelos multinivel frente a los de regresión: En un interesante trabajo de Afshartous y de Leeuw, muestran que si el objetivo de la modelización es predictivo (es decir, predecir nuevas observaciones), la elección del modelo es diferente de cuando el objetivo es la inferencia (donde se intenta ajustar el modelo a la estructura de los datos). El artículo al que me refiero es

Afshartous, D., de Leeuw, J. (2005). Predicción en modelos multinivel. J. Educat. Behavior. Statist. 30(2):109-139.

Acabo de encontrar otro artículo relacionado de estos autores aquí: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf

6voto

Chris Marasti-Georg Puntos 17023

He aquí un ejemplo en el que un modelo multinivel podría ser "esencial". Supongamos que se quiere calificar la "calidad" de la educación impartida por un conjunto de escuelas utilizando los resultados de los exámenes de los alumnos. Una forma de definir la calidad de la escuela es en términos de rendimiento medio en los exámenes después de tener en cuenta las características de los estudiantes. Esto se podría conceptualizar como, yis=αs+Xisβs+ϵis, donde yis es la puntuación de la prueba continua del alumno i en la escuela s , Xis son atributos de los estudiantes centrados en los medios escolares, βs es un coeficiente específico de la escuela sobre estos atributos, αs es un "efecto escuela" que mide la calidad escolar, y ϵis son las idiosincrasias de los estudiantes en su rendimiento en los exámenes. El interés aquí se centra en estimar la αs que miden el "valor añadido" que la escuela proporciona a los estudiantes una vez que se tienen en cuenta sus atributos. Se quiere tener en cuenta los atributos de los alumnos, porque no se quiere castigar a una buena escuela que tiene que atender a alumnos con ciertas desventajas, con lo que se deprimen los resultados medios de los exámenes a pesar del alto "valor añadido" que la escuela proporciona a sus alumnos.

Con el modelo en la mano, la cuestión se convierte en una estimación. Si tiene muchas escuelas y muchos datos para cada escuela, las buenas propiedades de OLS (véase Angrist y Pischke, Mayormente inofensivo... para una revisión actual) sugieren que se quiera usar eso, con ajustes adecuados a los errores estándar para tener en cuenta las dependencias, y usando variables ficticias e interacciones para obtener los efectos a nivel de escuela y los interceptos específicos de la escuela. OLS puede ser ineficiente, pero es tan transparente que podría ser más fácil convencer a las audiencias escépticas si se utiliza. Pero si sus datos son escasos en ciertos aspectos -en particular si tiene pocas observaciones para algunas escuelas- puede querer imponer más "estructura" al problema. Puede querer "tomar prestada la fuerza" de las escuelas de la muestra más grande para mejorar las estimaciones ruidosas que obtendría en las escuelas de la muestra pequeña si la estimación se hiciera sin estructura. Entonces, podría recurrir a un modelo de efectos aleatorios estimado a través de FGLS, o tal vez una aproximación a la verosimilitud directa dado un determinado modelo paramétrico, o incluso Bayes en un modelo paramétrico.

En este ejemplo, el uso de un modelo multinivel (independientemente de cómo decidamos ajustarlo, en última instancia) está motivado por el interés directo en los interceptos a nivel de escuela. Por supuesto, en otras situaciones, estos parámetros a nivel de grupo pueden no ser más que una molestia. La necesidad o no de ajustarlos (y, por tanto, de seguir trabajando con algún tipo de modelo multinivel) depende de si se cumplen ciertos supuestos de exogeneidad condicional. A este respecto, recomendaría consultar la literatura econométrica sobre los métodos de datos de panel; la mayoría de las ideas de allí se trasladan a contextos generales de datos agrupados.

2 votos

Este es un hilo antiguo, pero por si acaso lo lees: OLS con variables ficticias e interacciones no toma prestada la fuerza como las otras técnicas que mencionas, ¿verdad? Tengo unos datos en los que he dividido mi análisis en dos partes y he utilizado dos comandos lm (R linear model) para modelar las dos partes. He introducido una variable ficticia para indicar las dos partes, y luego he vuelto a utilizar lm en este modelo "unificado" y las respuestas son cercanas, pero no iguales. Mi pregunta sería: ¿es esa respuesta "mejor", o simplemente diferente debido al algoritmo?

0 votos

@Wayne: si ha utilizado variables ficticias y el conjunto completo de interacciones en el segundo, las estimaciones puntuales deberían ser las mismas. Los errores estándar pueden diferir porque el segundo método puede suponer un mayor número de grados de libertad, pero debería comprobar si se trata de un supuesto de modelización correcto.

6voto

patfla Puntos 1

La modelización multinivel es adecuada, como su nombre indica, cuando sus datos tienen influencias que se producen en diferentes niveles (individual, en el tiempo, en los dominios, etc.). Los modelos de un solo nivel suponen que todo ocurre en el nivel más bajo. Otra cosa que hace un modelo multinivel es introducir correlaciones entre unidades anidadas. Así, las unidades de nivel 1 dentro de la misma unidad de nivel 2 estarán correlacionadas.

En cierto sentido, se puede pensar en la modelización multinivel como un punto intermedio entre la "falacia individualista" y la "falacia ecológica". La falacia individualista es cuando se ignoran los "efectos de comunidad", como la compatibilidad del estilo de un profesor con el estilo de aprendizaje de un alumno, por ejemplo (se supone que el efecto procede únicamente del individuo, por lo que basta con hacer la regresión en el nivel 1). mientras que la "falacia ecológica" es lo contrario, y sería como suponer que el mejor profesor tuviera los alumnos con las mejores notas (por lo que el nivel 1 no es necesario, basta con hacer la regresión totalmente en el nivel 2). En la mayoría de los escenarios, ninguna de las dos cosas es apropiada (el alumno-profesor es un ejemplo "clásico").

Tenga en cuenta que en el ejemplo de la escuela, había una agrupación o estructura "natural" en los datos. Pero esta no es una característica esencial de la modelización multinivel/jerárquica. Sin embargo, la agrupación natural facilita las matemáticas y los cálculos. El ingrediente clave es la información previa que dice que hay procesos que ocurren en diferentes niveles. De hecho, se pueden idear algoritmos de agrupación imponiendo una estructura multinivel a los datos con incertidumbre sobre qué unidad está en cada nivel superior. Así, se tiene yij con el subíndice j siendo desconocido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X