3 votos

colinealidad perfecta entre múltiples variables continuas

Cuando existe una colinealidad perfecta entre más de dos variables continuas, ¿cómo se trata y cómo se interpretan los resultados de la regresión?

Tengo tres variables independientes que representan el porcentaje de diferentes razas dentro de diferentes ciudades, Say $x_1$ es el porcentaje de hispanos, $x_2$ es el porcentaje de negros y $x_3$ es el porcentaje de blancos. Lógicamente, $x_1 + x_2 + x_3 = 1$ .

La variable dependiente es la asistencia a la universidad entre la población de distintas ciudades. He eliminado una de las variables independientes ( $x_1$ ) y estimamos la siguiente ecuación:

$\hat{y}=\beta_0 + \beta_1 X_2 + \beta_2 X_3 $

  1. ¿Es ésta la mejor manera de abordar este problema?

  2. ¿Cómo debo interpretar los coeficientes de $\beta_1$ y $\beta_2$ . Si $\beta_1$ es igual a 3, por ejemplo, ¿debe interpretarse como: con 1 unidad de aumento del porcentaje de negros en la población de la ciudad, la asistencia al colegio aumenta en 3 unidades? ¿O debo considerar la variable omitida (X1: porcentaje de hispanos) como el grupo base y decir que una unidad de aumento en el porcentaje de negros aumenta la asistencia al colegio tres veces más que una unidad de aumento en el porcentaje de hispanos?

2voto

RGA Puntos 113

El gran problema es, por supuesto, que no se puede interpretar como el efecto de un cambio en un porcentaje mientras se mantiene constante el resto: si el porcentaje de un grupo aumenta, al menos uno de los grupos restantes debe disminuir, de lo contrario se acabaría con más del 100%.

Una solución que puede ayudar es elegir varias composiciones raciales y comparar los resultados previstos de las mismas. Por ejemplo, se pueden tomar las composiciones raciales de dos o más ciudades reales y comparar los resultados previstos de las mismas. Tomar las composiciones de ciudades reales suele ayudar a la comunicación con el público; es más fácil hablar de comparar Berlín con Stuttgart (vivo en Alemania), que comparar una ciudad con $x_1\%$ Negros, $y_1\%$ Hispanos y $z_1\%$ Blancos con una ciudad con $x_2\%$ Negros, $y_2\%$ Hispanos y $z_2\%$ Blancos.

También puede consultar el capítulo 12 de J. Aitchison (2003) Análisis estadístico de datos de composición The Blackburn Press.


En otro orden de cosas: cuidado con la interpretación de una regresión de este tipo utilizando datos a nivel de ciudad. Los resultados no pueden decir mucho sobre el comportamiento de los individuos. Es lo que se conoce como falacia ecológica:

W. S. Robinson (1950) "Las correlaciones ecológicas y el comportamiento de los individuos" Revista Sociológica Americana vol. 15, nº 3, pp. 351-357.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X