34 votos

¿Cómo diseñar e implementar una función de pérdida asimétrica para la regresión?

Problema

En la regresión se suele calcular el error medio cuadrático (MSE) para una muestra: $$ \text{MSE} = \frac{1}{n} \sum_{i=1}^n\left(g(x_i) - \widehat{g}(x_i)\right)^2 $$ para medir la calidad de un predictor.

Ahora mismo estoy trabajando en un problema de regresión en el que el objetivo es predecir el precio que los clientes están dispuestos a pagar por un producto dada una serie de características numéricas. Si el precio predicho es demasiado alto, ningún cliente comprará el producto, pero la pérdida monetaria es baja porque el precio puede simplemente disminuirse. Por supuesto, no debería ser demasiado alto, ya que entonces el producto podría no comprarse durante mucho tiempo. En cambio, si el precio previsto es demasiado bajo, el producto se comprará rápidamente sin posibilidad de ajustar el precio.

En otras palabras, el algoritmo de aprendizaje debería predecir precios ligeramente más altos, que pueden reducirse si es necesario, en lugar de subestimar el precio real, lo que supondría una pérdida monetaria inmediata.

Pregunta

¿Cómo diseñarías una métrica de errores que incorpore esta asimetría de costes?


Posible solución

Una forma de definir una función de pérdida asimétrica sería simplemente multiplicar por un peso: $$ \frac{1}{n} \sum_{i=1}^n \left| \alpha - \mathbb{1}_{(g(x_i) - \widehat{g}(x_i)) < 0} \right|\cdot \left(g(x_i) - \widehat{g}(x_i)\right)^2 $$ con $\alpha \in (0,1)$ siendo el parámetro que podemos ajustar para cambiar el grado de asimetría. He descubierto que aquí . Esto parece lo más sencillo de hacer, manteniendo la pérdida cuadrática.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X