Quiero predecir las etiquetas de las imágenes utilizando una red neuronal. Todas las etiquetas se encuentran en el intervalo [-1,1] (escala de relación). Los valores con un valor absoluto superior a uno no tienen sentido y no aparecen en los datos.
¿Cómo se diseña la capa final? ¿Qué función de pérdida debo utilizar?
Mi enfoque es una activación "tanh", para comprimir la salida en [-1,1] y 'MSE' como función de pérdida. ¿Tiene sentido?