El coeficiente de correlación se escribe generalmente con un % de capital pero a veces no. ¿Me pregunto si realmente hay una diferencia entre y ? ¿Puede significar algo distinto de un coeficiente de correlación?
Respuesta
¿Demasiados anuncios?La notación en este asunto parece variar un poco.
es utilizado en el contexto de la correlación múltiple y se llama la "correlación múltiple coeficiente". Es la correlación entre las respuestas observadas e las ajustado por el modelo. El es generalmente predicho a partir de varias variables predictoras , por ejemplo, donde el intercepto y la pendiente de los coeficientes han sido estimados a partir de los datos. Tenga en cuenta que .
El símbolo es la "muestra el coeficiente de correlación" que se utiliza en el caso bivariante - es decir, hay dos variables, - y por lo general significa que la correlación entre el en la muestra. Usted puede tratar esto como una estimación de la correlación entre las dos variables en el conjunto de la población. Para correlacionar dos variables no es necesario identificar cual es el predictor y cual es la respuesta. De hecho, si usted se ha encontrado correlación entre el sería la misma que la correlación entre el, debido a que la correlación es simétrica. Tenga en cuenta que cuando el símbolo se utiliza de esta manera, con (correlación negativa) si las dos variables tienen un linealmente decreciente de la relación (como uno sube, el otro tiende a ir hacia abajo).
Donde la notación se vuelve incoherente es cuando hay dos variables, , y una regresión lineal simple se realiza. Esto significa que la identificación de una variable, , ya que la variable de respuesta, y el otro, , ya que la variable predictora, y ajustar el modelo a . Algunas personas también utilizan el símbolo a indicar la correlación entre el, mientras que otros (por coherencia con la regresión múltiple) escribir . Tenga en cuenta que la correlación entre el observado y equipado respuestas es necesariamente mayor que o igual a cero. Esta es una razón por la que no me gusta el uso del símbolo de en este caso: la correlación entre el puede ser negativa, mientras que la correlación entre el es positivo (de hecho, es simplemente será el módulo de la correlación entre el), aunque ambos podrían estar escrito con el símbolo . He visto algunos libros de texto, y en los artículos de Wikipedia, cambiar casi indistintamente entre los dos significados de e pareció innecesariamente confuso. Yo prefiero usar el símbolo la correlación entre el , tanto individuales y de regresión múltiple.
En tanto simple como múltiple, regresion, a continuación, en tanto no haya un término de intersección, instalada en el modelo, el es simplemente la raíz cuadrada del coeficiente de determinación ( (a menudo llamado "la proporción de la varianza explicada" o similar). En el caso de regresión lineal simple específicamente, a continuación, donde estoy escribiendo la correlación entre el , e podría representar el coeficiente de determinación de la regresión o el cuadrado de la correlación entre el. Desde , esto significa que . Así, por ejemplo, si usted consigue una correlación entre el, la correlación entre el y el amueblada a partir de la regresión lineal simple y el coeficiente de determinación quedaría es decir, casi la mitad de la variación en la respuesta sería explicado por el modelo.
Si no hay ningún término de intersección se incluyó en el modelo, entonces el símbolo es ambiguo — es usualmente concebido como el coeficiente de determinación, pero ya que esto generalmente se calcula de una manera diferente a la habitual, así que tenga cuidado cuando la lectura de la salida de su software estadístico), entonces ya no es el mismo como el cuadrado de la correlación múltiple , ni en el caso bivariante será igual !