Estoy evaluando el error en tres modelos de validación cruzada trazando las observaciones frente a las predicciones. Para ello, comparo el RMSE (error cuadrático medio) y la R de Pearson entre las predicciones y las observaciones.
( Nota: modelos binomiales negativos, muestra n = 49
, mean = 13.33
y SD = 17.27
)
Los resultados del RMSE son 18,81, 18,97 y 17,48, respectivamente. Las R de Pearson son 0,10, 0,09 y 0,33.
¿Cómo puedo interpretar esta enorme diferencia (~70%) en los valores de correlación pero con sólo cambios menores (~10%) en el RMSE? ¿Estoy en lo cierto si digo que el tercer modelo funciona mucho mejor en la predicción de valores extremos que los otros dos? Esencialmente, entiendo que en una predicción basada en la media la correlación sería 0 pero el RMSE podría no ser tan alto debido a que las sobrepredicciones compensan las infrapredicciones (?). ¿Hay alguna otra alternativa?