El contexto se relaciona con una situación en la que estoy interesado en ver si el tamaño de las clases predice los resultados de las pruebas. Tengo los resultados de los exámenes de cada individuo, y el tamaño de la clase de cada individuo. Se me ha advertido que no debo calcular simplemente el resultado de la prueba de cada clase (por lo tanto, hacer una nueva variable class_test_average, y luego usar class_size para predecir class_test_average. Se me ha informado que si lo hago podría tener un problema con el "sesgo de agregación" y "la falacia ecológica". Sin embargo, estos conceptos me fueron expresados de una manera un tanto agitada. He comprendido que la falacia ecológica se relaciona con las inferencias de que las relaciones a nivel macro se traducirán en las mismas relaciones a nivel micro. Sin embargo, no entendí el sesgo de agregación en absoluto.
Esto no es prácticamente un problema serio para mí, ya que estaba planeando hacer un modelo multinivel de todos modos, lo que supongo que evitará tanto el sesgo de la agregación como la falacia ecológica. Sin embargo, tengo curiosidad por saber qué significa realmente el sesgo de agregación. No hay ningún artículo de Wikipedia que hable de este tema, y al buscar en Google aparecen todo tipo de definiciones. Sin embargo, creo que la cita clásica en esta área es James (1982) .
Para mí, el término sesgo indica que por agregación debería estar empujando sistemáticamente los resultados para sobreestimar o subestimar el tamaño de las relaciones. Sin embargo, no me queda claro que eso suceda realmente.
James, L. R. (1982). Aggregation bias in estimates of perceptual agreement. Journal of Applied Psychology, 67(2), 219.