3 votos

Coeficiente de correlación bajo y error cuadrático medio bajo

Tengo una serie de precios reales y precios previstos. Los valores de los cuales se dan a continuación. Ahora, cuando trato de encontrar el coeficiente de correlación utilizando la función R cor(precio real, precio previsto) obtengo 0,6769881. Pero cuando intento hallar el error cuadrático medio, el valor es 3,634382e-05, que me parece un poco bajo para el coeficiente de correlación correspondiente. ¿Hay algo que esté haciendo mal?

     **predicted Price**                            **Actual Price** 
        4.760972                                      4.780 
        4.767296                                      4.779
        4.776825                                      4.775
        4.776761                                      4.776
        4.775952                                      4.779
        4.776835                                      4.777
        4.772703                                      4.776
        4.774033                                      4.778
        4.774343                                      4.779
        4.778052                                      4.783
        4.779570                                      4.779
        4.774922                                      4.781
        4.777020                                      4.779
        4.780514                                      4.786
        4.784221                                      4.784
        4.780591                                      4.780 
        4.782547                                      4.784
        4.783528                                      4.785
        4.784811                                      4.783
        4.787684                                      4.787
        4.790639                                      4.787

4voto

icelava Puntos 548

El coeficiente de correlación y el MSE miden dos cosas distintas.

  • El coeficiente de correlación mide esencialmente hasta qué punto se puede aproximar el precio real mediante una función lineal afín del precio previsto. Compara el precio real con el precio previsto y traza una línea de regresión a través del diagrama de dispersión: el coeficiente de correlación te dirá cuánto se dispersan los puntos alrededor de la línea.

  • El MSE calcula... bueno, el error cuadrático medio. En el gráfico de dispersión mencionado anteriormente, dibuja una línea vertical desde cada punto hasta la línea de regresión y, a continuación, calcula la media de las áreas de los cuadrados sobre esas líneas verticales. Ese es tu MSE.

Ambas medidas aumentarán si el gráfico de dispersión se "aleja" de la línea de regresión, pero ésa es realmente toda la relación que tienen. (Por ejemplo, multiplique todos los precios por 100, para medirlos en céntimos en lugar de en dólares. Entonces su MSE aumentará en un factor de 10.000, pero la correlación se mantendrá sin cambios. Y en su gráfico de dispersión, lo único que cambiará será la escala de los ejes). Así que no debería sorprenderse de no encontrar una relación entre la correlación y el MSE, porque realmente no hay razón para esperar una.

(Por cierto, no es obvio lo que sería una correlación o un MSE "grande" o "pequeño" en este contexto. Y parece que estás haciendo previsiones/predicciones; capítulo de este libro sobre la evaluación de la precisión de las previsiones puede ser útil).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X