Intento interpretar el signo de mis 5 variables x frente a la variable y. El signo de algunos coeficientes en la salida de la regresión (comando: reg) son diferentes a los signos en la matriz de correlación (comando: correlate). ¿Cuál define el signo/dirección de la relación?
Respuesta
¿Demasiados anuncios?El coeficiente de correlación es la relación simple incondicional entre Y y x1 . El coeficiente de regresión es el impacto condicional sobre Y DADO x2,x3,x4 y x5. Tendrían el mismo signo si x1,x2,x3,x4,x5 fueran ortogonales (no correlacionadas) entre sí. Como reflejó correctamente @Whuber, si no son ortogonales pueden o no tener el mismo signo.
RESPUESTA AMPLIADA PARA HACERLA MÁS CONSTRUCTIVA:
Considere el siguiente conjunto de datos donde la correlación simple entre Y y X1 es positiva Analicemos Y en función de X1 y X2 . Primero por separado y luego juntos. El coeficiente de regresión de la relación incondicional entre Y y M_X1 es de 0,463 ( mismo signo que la correlación simple ) mientras que el impacto condicional de M_X1 dado M_X2 es de -1,222 ( distinto signo ). Como otros han señalado, esto se denomina a veces " falacia del signo esperado", "paradoja de Simpson", "falacia ecológica", etc. En resumen, el análisis condicional (regresión múltiple) suele ser diferente del análisis incondicional (regresión simple) porque las variables predictoras no son independientes entre sí.