6 votos

¿Qué es el sesgo de agregación, y cómo se relaciona con la falacia ecológica?

El contexto se relaciona con una situación en la que estoy interesado en ver si el tamaño de las clases predice los resultados de las pruebas. Tengo los resultados de los exámenes de cada individuo, y el tamaño de la clase de cada individuo. Se me ha advertido que no debo calcular simplemente el resultado de la prueba de cada clase (por lo tanto, hacer una nueva variable class_test_average, y luego usar class_size para predecir class_test_average. Se me ha informado que si lo hago podría tener un problema con el "sesgo de agregación" y "la falacia ecológica". Sin embargo, estos conceptos me fueron expresados de una manera un tanto agitada. He comprendido que la falacia ecológica se relaciona con las inferencias de que las relaciones a nivel macro se traducirán en las mismas relaciones a nivel micro. Sin embargo, no entendí el sesgo de agregación en absoluto.

Esto no es prácticamente un problema serio para mí, ya que estaba planeando hacer un modelo multinivel de todos modos, lo que supongo que evitará tanto el sesgo de la agregación como la falacia ecológica. Sin embargo, tengo curiosidad por saber qué significa realmente el sesgo de agregación. No hay ningún artículo de Wikipedia que hable de este tema, y al buscar en Google aparecen todo tipo de definiciones. Sin embargo, creo que la cita clásica en esta área es James (1982) .

Para mí, el término sesgo indica que por agregación debería estar empujando sistemáticamente los resultados para sobreestimar o subestimar el tamaño de las relaciones. Sin embargo, no me queda claro que eso suceda realmente.

James, L. R. (1982). Aggregation bias in estimates of perceptual agreement. Journal of Applied Psychology, 67(2), 219.

5voto

Michel Marcus Puntos 21

De Clark y Avery (1976):

Desde hace mucho tiempo se sabe que el uso de datos agregados puede dar lugar a coeficientes de correlación que exhiben un sesgo considerable por encima de sus valores a nivel individual [10, 21]; y Blalock [2] ha demostrado que los coeficientes de regresión también pueden estar sesgados. Está bien establecido que es incorrecto suponer que las relaciones existentes en un nivel de análisis demostrarán necesariamente la misma fuerza en otro nivel. Las estimaciones derivadas de los datos agregados sólo son válidas para el sistema particular de unidades de observación empleado. Las consecuencias de utilizar estimaciones potencialmente sesgadas de los coeficientes de correlación y regresión como sustitutos de las "verdaderas" estimaciones a micronivel son más graves en lo que respecta a las inferencias causales que deben extraerse de los análisis estadísticos

Y un poco más adelante en el documento, en relación con cómo se relacionan el sesgo de agregación y la falacia ecológica (la negrita es mía):

Probablemente la desventaja más grave de la utilización de datos agregados es la dificultad inherente de hacer inferencias válidas en varios niveles basadas en un solo nivel de análisis [1]. Alker ha identificado tres tipos de inferencias erróneas que pueden aparecer si un investigador intenta generalizar de un nivel de investigación a otro. La falacia individualista es el intento de imputar relaciones de macronivel (agregado) a partir de relaciones de micronivel (individuales). Es el clásico problema de agregación examinado por primera vez por los economistas, y según Hannan [15, p. 5] se trata de intentos de agrupar observaciones sobre 'unidades de comportamiento' para investigar las relaciones económicas que se mantienen para sectores o economías totales". Las falacias en todos los niveles puede ocurrir cuando se hacen inferencias de una subpoblación a otra en el mismo nivel de análisis. La falacia ecológica El nombre de la obra de Robinson [18], es lo opuesto a la falacia individualista e implica hacer inferencias de niveles de análisis más altos a más bajos. Robinson demostró que no había necesariamente una correspondencia entre las correlaciones individuales y las ecológicas, y que generalmente la última sería mayor que la primera. Aunque la falacia ecológica ha sido ampliamente discutida y divulgada, sigue siendo un error común en los estudios que implican inferencias causales.

Clark, W. A., & Avery, K. L. (1976). The effects of data aggregation in statistical analysis. Geographical Analysis, 8(4), 428-438.

El documento está disponible en formato PDF en Google Scholar (no hay enlaces porque los enlaces se rompen)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X