Denotemos el verdadero valor de interés como θθ y el valor estimado mediante algún algoritmo como ˆθ^θ .
Correlación le dice cuánto θθ y ˆθ^θ están relacionados. Da valores entre −1−1 y 11 , donde 00 no tiene relación, 11 es una relación lineal muy fuerte y −1−1 es una relación lineal inversa (es decir, valores mayores de θθ indican valores menores de ˆθ^θ o viceversa). A continuación encontrará un ejemplo ilustrado de correlación.
![Correlation example]()
(fuente: http://www.mathsisfun.com/data/correlation.html )
El error absoluto medio es:
MAE=1NN∑i=1|ˆθi−θi|MAE=1NN∑i=1|^θi−θi|
Raíz error cuadrático medio es:
RMSE=√1NN∑i=1(ˆθi−θi)2RMSE=
⎷1NN∑i=1(^θi−θi)2
Relativo error absoluto :
RAE=∑Ni=1|ˆθi−θi|∑Ni=1|¯θ−θi|RAE=∑Ni=1|^θi−θi|∑Ni=1|¯¯¯θ−θi|
donde ¯θ¯¯¯θ es un valor medio de θθ .
Error cuadrático relativo de la raíz:
RRSE=√∑Ni=1(ˆθi−θi)2∑Ni=1(¯θ−θi)2RRSE=
⎷∑Ni=1(^θi−θi)2∑Ni=1(¯¯¯θ−θi)2
Como ves, todas las estadísticas comparan los valores reales con sus estimaciones, pero lo hacen de forma ligeramente diferente. Todas te dicen "a qué distancia" están tus valores estimados del valor real de θθ . A veces se utilizan raíces cuadradas y a veces valores absolutos - esto es porque cuando se utilizan raíces cuadradas los valores extremos tienen más influencia en el resultado (ver ¿Por qué elevar al cuadrado la diferencia en lugar de tomar el valor absoluto en la desviación estándar? o en Mathoverflow ).
En MAEMAE y RMSERMSE simplemente se mira la "diferencia media" entre esos dos valores - así se interpreta comparando con la escala de su valor, (es decir MSEMSE de 1 punto es una diferencia de 1 punto de θθ entre ˆθ^θ y θθ ).
En RAERAE y RRSERRSE se dividen esas diferencias por la variación de θθ por lo que tienen una escala de 0 a 1 y si se multiplica este valor por 100 se obtiene la similitud en la escala 0-100 (es decir, el porcentaje). Los valores de ∑(¯θ−θi)2∑(¯¯¯θ−θi)2 o ∑|¯θ−θi|∑|¯¯¯θ−θi| te diga cuánto θθ difiere de su valor medio - por lo que se podría decir que se trata de cuánto θθ difiere de sí mismo (compárese con desviación ). Por ello, las medidas se denominan "relativas": dan un resultado relacionado con la escala de θθ .
Compruebe también esas diapositivas .