Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

4 votos

¿Cómo elegir la función de pérdida (en el ilimitado espacio de parámetros)?

¿Cómo elegir una función de pérdida para un determinado problema? (He mirado a través de stackexchange, y no he sido capaz de encontrar un hilo que trata sobre esto.)

Vamos a decir que observar algunos datos de xRn, y estoy interesado en la estimación de algunos parámetros θ relacionados con la distribución de la que x vino. Supongamos que θ se encuentra en un ilimitado espacio de parámetros. Supongamos que estoy interesado en un estimador de la forma: ˆθ=argmin donde \mathcal{L} es una cierta pérdida de la función. Hay una serie de principios para elegir a \mathcal{L}?

Algunos comentarios:

  • Una forma de elegir la función de pérdida sería a través de un probabilístico enfoque de modelado. Por ejemplo, el uso de cuadrados de error en la regresión podría estar motivado como ser natural derivada de la probabilidad de una gaussiana esférica con la covarianza. Sin embargo, esta función de pérdida ha recibido algún tipo de justificación en este contexto, más allá de los supuestos de normalidad de Gauss-Markov teorema.
  • La pérdida de las funciones que he visto de GLMs también se derivan de consideraciones probabilísticas. Sin embargo, sabemos que el coeficiente estimado es robusta, ya que todavía será consistente, incluso si la distribución está mal especificada (siempre y cuando el enlace está correctamente especificado y todos los de la verdadera covariables incluidas.) (Ver Gourieroux, C., A. Monfort y A. Trognon. 1984. Pseudo métodos de máxima verosimilitud: de la teoría. Econometrica 52: 681-700.) Esto proporciona algunos (asintótica) solidez a la elección de la función de pérdida.
  • Cuando se hace no negativo de la factorización de la matriz, se puede considerar que la probabilidad negativo cuando suponiendo que la matriz de entradas provienen de una distribución de Poisson. Sin embargo, podemos demostrar que la pérdida de la función derivada de esto es equivalente a (generalizada) de kullback-leibler divergencia. Véase, por ejemplo, la Relación entre la generación de Poisson y generalizada de Kullback-Leibler divergencia. Esto es bueno ya que proporciona una información de la teoría de la motivación de la pérdida de la función.
  • La función de pérdida podrían ser escogidos por consideraciones prácticas, tales como la eficiencia computacional. Seguramente error cuadrado ha recibido el kilometraje por esta razón.
  • Tal vez, si la situación lo requiere este tipo de propiedad, la pérdida de función puede ser derivada en un ad-hoc manera mediante la introducción de la asimetría en un simétrica de la función de pérdida.
  • En el aprendizaje de máquina, las funciones objetivo se utilizan a menudo que no se derivan de los modelos probabilísticos; sin embargo, no estoy seguro de si esas funciones objetivo debe ser considerada pérdida de las funciones.

¿Hay alguna teoría sobre la elección y el efecto de la pérdida de la función?

Yo también estoy interesado en la elección de la función de pérdida cuando la determinación de la admisibilidad de un estimador. Así, en este escenario, un estimador es dado, y estamos interesados en determinar si el riesgo (o de la pérdida esperada) del estimador está siempre dominada por otro estimador. Hay un marco de referencia para elegir una función de pérdida en este valor, que es diferente en el lugar donde hacemos uso de la función de pérdida para producir un estimador?

1voto

Aksakal Puntos 11351

Canónicamente su función de pérdida debe reflejar las pérdidas que usted sufra de error de previsión. Por ejemplo, cuando el pronóstico del tiempo dice que no hay lluvia el día de hoy, mientras llueve, puede llamar a un taxi para llegar a casa en lugar de caminar y le cuesta a usted 10. Alternatively, the forecast projected rain, so you drove to work instead of walking, which cost you 2 de gas. Así, su función de pérdida es (falso lluvia: 1, falso clara: 5)

En un mundo real la gente no se molesta para la construcción de la pérdida de las funciones de sus problemas, pero el uso de una de las opciones predeterminadas, tales como RMSE o MAE. Por qué? Principalmente, porque no saben mejor, pero también porque es "difícil".

Tenga en cuenta, que la función de pérdida es no relacionadas con probabilidades o posibilidades a todos. Minimizar la probabilidad ponderada de la pérdida, es decir, de cada pérdida estará vinculada a la probabilidad, entonces, la pérdida esperada se reduce al mínimo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X