Estoy de acuerdo con @jlesuffleur en que se debe utilizar un conjunto de algoritmos con aleatorización. Sin embargo, hay que tener en cuenta que, idealmente, un MLP debería converger a un conjunto de pesos y la inicialización aleatoria sólo se supone que acelera la llegada a ese punto.
Si los resultados de tu MLP varían mucho entre diferentes inicializaciones de pesos, eso podría ser un indicio de que no aprende mucho sobre los datos. Asegúrate de que el número de muestras de entrenamiento es mayor que el número de parámetros independientes (número de pesos), que pueden ser miles en el caso de los MLP. De lo contrario, hay pocas esperanzas de obtener predicciones significativas del MLP.
En cuanto a las medidas de error, el porcentaje medio de error es fácilmente comprensible para los profanos y, por tanto, muy adecuado para hablar con los clientes, etc. Para la selección de modelos, debería utilizar una medida diferente, como el error medio absoluto o la raíz del error medio cuadrático.
La razón es que el MAPE es más susceptible a los errores en lugares donde el valor original es pequeño. Una desviación de 10 unidades contribuye en un 10% cuando el valor real era 100, pero sólo en un 2% cuando el valor real era 500.
El MAE y el RMSE proporcionan valores difíciles de interpretar, pero son más adecuados para comparar diferentes modelos. El RMSE castiga más las desviaciones grandes que el MAE, pero cuál de los dos enfatizar depende de usted y de los requisitos del proyecto.