114 votos

¿Cómo funciona el coeficiente de correlación de diferir de la pendiente de regresión?

Yo habría esperado que el coeficiente de correlación a ser la misma que la pendiente de regresión (beta), pero sólo en comparación con los dos, son diferentes. ¿En qué se diferencian - ¿qué información dan?

126voto

Niall Puntos 51

Suponiendo que estamos hablando de un simple modelo de regresión $$Y_i = \alpha + \beta X_i + \varepsilon_i$$ estimado por mínimos cuadrados, sabemos de la wikipedia que $$ \hat {\beta} = {\rm cor}(Y_i, X_i) \cdot \frac{ {\rm SD}(Y_i) }{ {\rm SD}(X_i) } $$ por lo Tanto los dos sólo coinciden cuando ${\rm SD}(Y_i) = {\rm SD}(X_i)$. Es decir, que sólo coinciden cuando las dos variables están en la misma escala, en algún sentido. La forma más común de lograr esto es a través de la normalización, como se indica por @gung.

Los dos, en cierto sentido, te dan la misma información de cada uno de ellos dirá la fuerza de la lineal la relación entre los $X_i$ y $Y_i$. Pero, ¿cada uno le dará información diferente (excepto, claro, cuando son exactamente lo mismo):

  • La correlación da un almacén de medición que pueden ser interpretadas de forma independiente de la escala de las dos variables. Cuanto más cerca de la estimación de la correlación es de $\pm 1$, más cerca de los dos son de una perfecta relación lineal. La pendiente de regresión, en el aislamiento, no digo que la pieza de información.

  • La pendiente de regresión ofrece un útil cantidad interpreta como el cambio estimado en el valor esperado de $Y_i$ para un determinado valor de $X_i$. Específicamente, $\hat \beta$ indica el cambio en el valor esperado de $Y_i$ correspondiente al 1-unidad de incremento en $X_i$. Esta información no puede ser deducida a partir del coeficiente de correlación solo.

26voto

Sean Hanley Puntos 2428

Con la regresión lineal simple (es decir, sólo 1 covariable), la pendiente de $\beta_1$ es el mismo de Pearson $r$ si ambas variables fueron estandarizadas en primer lugar. (Para obtener más información, usted podría encontrar mi respuesta aquí útil). Cuando usted está haciendo la regresión múltiple, esto puede ser más complicado debido a , etc.

24voto

Underminer Puntos 1112

El coeficiente de correlación mide la fuerza de la relación lineal entre dos variables y se encuentra acotada entre -1 y 1, inclusive. Correlaciones cercanas a cero representan ninguna asociación lineal entre las variables, mientras que las correlaciones cercanas a -1 o +1 indican una fuerte relación lineal. De forma intuitiva, más fácil es para que se dibuje una línea de mejor ajuste a través de un diagrama de dispersión, la más correlacionados son.

La pendiente de regresión de las medidas de la "inclinación" de la relación lineal entre dos variables y puede tomar cualquier valor desde $-\infty$ $+\infty$. Laderas cerca de cero significa que la respuesta de la (S) variable cambia lentamente como el predictor (X) los cambios de variables. Las laderas que están más lejos de cero (ya sea en forma negativa o positiva) significa que la respuesta a los cambios más rápidamente a medida que el predictor de los cambios. Intuitivamente, si se dibuja una línea de mejor ajuste a través de un diagrama de dispersión, la más pronunciada es la que es, más que su pendiente es cero.

Por lo que el coeficiente de correlación y la regresión de pendiente DEBE tener el mismo signo (+ o -), pero casi nunca tienen el mismo valor.

Por simplicidad, esta respuesta supone la regresión lineal simple.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X