Me gustaría comprender conceptualmente el error medio cuadrático (RMSE) y la desviación media del sesgo (MBD). Tras calcular estas medidas para mis propias comparaciones de datos, a menudo me he quedado perplejo al comprobar que el RMSE es alto (por ejemplo, 100 kg), mientras que la MBD es baja (por ejemplo, menos del 1%).
Más concretamente, estoy buscando una referencia (no en línea) que enumere y discuta las matemáticas de estas medidas. ¿Cuál es la forma normalmente aceptada de calcular estas dos medidas, y cómo debería informar de ellas en un artículo de revista?
En el contexto de este post, sería muy útil disponer de un conjunto de datos "de juguete" que pueda utilizarse para describir el cálculo de estas dos medidas.
Por ejemplo, supongamos que tengo que encontrar la masa (en kg) de 200 widgets producidos por una cadena de montaje. También tengo un modelo matemático que intentará predecir la masa de estos widgets. El modelo no tiene por qué ser empírico y puede tener una base física. Calculo el RMSE y el MBD entre las mediciones reales y el modelo, y descubro que el RMSE es de 100 kg y el MBD es del 1%. ¿Qué significa esto conceptualmente y cómo debo interpretar este resultado?
Supongamos ahora que, a partir del resultado de este experimento, encuentro que el RMSE es de 10 kg y el MBD es del 80%. ¿Qué significa esto y qué puedo decir sobre este experimento?
¿Cuál es el significado de estas medidas y qué implican ambas (en conjunto)? ¿Qué información adicional aporta la DPM cuando se considera con el RMSE?