Estoy analizando los resultados de varios modelos de aprendizaje automático para una tarea de regresión, utilizando cuatro métricas: RMSE, MAE, MAPE y $R^2$. Mi enfoque implica dos tipos de análisis:
- Análisis de Métricas Individuales: Donde se considera cada métrica por separado.
- Análisis de Métricas de Rendimiento Compuestas: Una métrica combinada para determinar el mejor modelo entre los candidatos.
La Métrica de Rendimiento Compuesta (MRC) incorpora la media estandarizada de las métricas derivadas de los resultados individuales obtenidos a través de la validación cruzada:
$$ \begin{equation} \text{MRC} = M_{norm}(\text{RMSE}) + M_{norm}(\text{MAE}) + M_{norm}(\text{MAPE}) - M_{norm}(R^2) \end{equation} $$
donde
$$ \begin{equation} M_{norm}(\text{métrica}) = \frac{\text{métrica} - \mu_{\text{métrica}}}{\sigma_{\text{métrica}}} \end{equation} $$ y $\mu_\text{métrica}$ es la media general de la métrica entre todos los modelos, y $\sigma_\text{métrica}$ es la desviación estándar general de la métrica entre todos los modelos.
La MRC prioriza modelos con errores más bajos (RMSE, MAE, MAPE) y valores más altos de $R^2$. Al estandarizar cada métrica, la MRC asegura que todas las métricas contribuyan de manera equitativa, permitiendo una comparación justa entre diferentes modelos. Básicamente funciona como una suma ponderada donde cada métrica tiene el mismo peso.
El Problema con los Cambios de Signo
Sin embargo, me he encontrado con un problema potencial: durante el proceso de estandarización, los signos de algunas métricas pueden cambiar. Esto podría llevar a resultados engañosos al calcular la MRC. Por ejemplo, si el signo de $R^2$ cambia debido a la estandarización, podría aumentar inadvertidamente la MRC, penalizando a modelos que deberían ser recompensados por sus valores de $R^2$ más altos.
Solución Propuesta
Para abordar este problema, estoy considerando el siguiente enfoque:
- Métricas de Error (RMSE, MAE, MAPE): Dado que estas métricas son no negativas, propongo tomar el valor absoluto de las métricas estandarizadas para asegurar que siempre contribuyan positivamente a la MRC.
- $R^2$ Métrica: Sugiero preservar el signo original de $R^2$ antes de la estandarización y volver a aplicarlo después para mantener su influencia deseada en la MRC.
Solicitud de Comentarios
¿Les parece válido este enfoque, o estoy pasando por alto algo? ¿Existen métodos alternativos o consideraciones que podrían abordar mejor el problema de los cambios de signo durante la estandarización en el contexto de la MRC?