Estoy trabajando en la evaluación continua de un modelo de regresión sobre datos de flujo de los sensores. Creo que el Error Absoluto Medio (MAE) se puede averiguar de forma iterativa de forma similar a este enlace para promediar. $$ MAE_{t} = \left(\frac{N_t-1}{N_t}\right) MAE_{t-1} + \left(\frac{1}{N_t}\right) \left|y_t^{true}-y_t^{pred} \right| $$ Prefiero el error cuadrático medio (RMSE) al MAE, ya que penaliza más los valores de error más altos (como se menciona en ¿Error medio absoluto o error medio cuadrático? )
¿Existe un método para hallar el error cuadrático medio (RMSE) de forma similar?
He pensado en las siguientes formas:
-
Mantenga una ventana grande de valores anteriores y calcule el RMSE continuamente cada vez que llegue un nuevo dato. (Esto es costoso tanto en tiempo como en complejidad espacial)
-
Llevar la cuenta de los errores al cuadrado, es decir $$SqSum_{t} = SqSum_{t-1}+ \left(y_t^{true}-y_t^{pred} \right)^{2}$$ y encontrar $$ RMSE_t= \sqrt{\frac{Sum_{t}}{N_t}}$$ En este enfoque, me temo que la suma al cuadrado puede desbordar el límite de números para los más grandes $N_t$ .
¿Existe una forma mejor de encontrar el RMSE?
Agradecería que hubiera enfoques que dieran más peso a los errores de las predicciones más recientes.