Estas son las distribuciones empíricas del error para XGB, RF y kNN, este último se ha tomado en otro conjunto de datos.
Ninguno de ellos se distribuye normalmente, pero todos son simétricos. Ninguno de los algoritmos utilizados ha utilizado el MSE óptimo, por ejemplo, tanto XGB como RF utilizan un enfoque codicioso debido a que se basan en el árbol de decisión y kNN utiliza la distancia euclídea, que no tiene nada que ver con el MSE porque ni siquiera es una estimación basada en el error; supongo que esto se debe a que los métodos basados en la cuadrática ignoran la señal de error, pero no puedo relacionarlo con la simetría en el sentido de la densidad de probabilidad.