9 votos

¿Cuál sería un ejemplo de cuando la L2 es una buena función de pérdida para calcular una pérdida posterior?

L2 pérdida, junto con L0 y L1 pérdida, tres son una forma muy común de "default" de la pérdida de las funciones que se usan cuando resumiendo una posterior por la mínima posterior de la pérdida esperada. Una razón para esto es tal vez que son relativamente fáciles de calcular (al menos para 1d-distribuciones), L0 resultados en el modo de la L1 en la mediana y L2 resultados en la media. Cuando la enseñanza, me puede venir para arriba con escenarios donde L0 y L1 son razonables pérdida de las funciones (y no sólo "por defecto"), pero estoy luchando con un escenario donde L2 sería razonable función de pérdida. Así que mi pregunta:

Finalidades pedagógicas, lo que sería un ejemplo de cuando la L2 es una buena función de pérdida para el cálculo de un mínimo de pérdida posterior?

Para L0 es fácil llegar a los escenarios de las apuestas. Decir que se ha calculado un posterior sobre el número total de goles en un próximo juego de fútbol y se va a hacer una apuesta en la que puedes ganar $$$ si usted adivinar el número de goles y perder lo contrario. Entonces L0 razonable es una función de pérdida.

Mi L1 ejemplo es un poco artificial. Que conoce a un amigo que va a llegar a uno de los muchos aeropuertos y, a continuación, viajar por carro, el problema es que no sabe de qué aeropuerto (y no puede llamar a su amigo, porque ella está en el aire). Dado un posterior sobre el que el aeropuerto podría tierra, donde es un buen lugar para posicionarte de manera que la distancia entre ella y usted será pequeño, cuando ella llega? Aquí, el punto que minimiza la espera L1 pérdida parece razonable, si la realización de los supuestos simplificadores que su coche va a viajar a velocidad constante directamente a su ubicación. Es decir, una hora de espera es de dos veces tan mal como a 30 min de espera.

4voto

Bou Puntos 1859
  1. L2 es "fácil". Es lo que se obtiene por defecto si no estándar de la matriz de métodos como la regresión lineal, enfermedad vesicular porcina, etc. Hasta que nos había ordenadores, L2 fue el único juego en la ciudad para una gran cantidad de problemas, que es por qué todo el mundo utiliza ANOVA, pruebas t, etc. También es más fácil obtener una respuesta exacta el uso de la L2, con la pérdida de muchos más elegante métodos como el de Gauss procesos que tener una respuesta exacta uso de otros pérdida de las funciones.

  2. Relatedly, usted puede conseguir el L2 de la pérdida utilizando exactamente un 2º-el fin de Taylor aproximación, que no es el caso para la mayoría de la pérdida de las funciones (por ejemplo, la entropía ). Esto hace que la optimización fácil con la 2ª orden de métodos como el método de Newton. Muchos de los métodos para tratar con otros pérdida de las funciones todavía utilizan métodos para L2 pérdida bajo el capó", por el mismo motivo (por ejemplo, de forma iterativa reponderadas de los mínimos cuadrados, integrado anidada de Laplace aproximaciones).

  3. L2 está estrechamente relacionada con la distribución Gausiana, y el Teorema del Límite Central hace de distribución Gausiana común. Si los datos de generación de proceso (condicional) Gaussiana, entonces L2 es el estimador más eficiente.

  4. L2 pérdida se descompone muy bien, debido a la ley de la varianza total. Que hace que ciertos gráfica de los modelos con variables latentes especialmente fáciles de montar.

  5. L2 penaliza a los terribles predicciones de manera desproporcionada. Esto puede ser bueno o malo, pero es a menudo bastante razonable. Una hora de espera puede ser de cuatro veces tan malo como 30 minutos de espera que, en promedio, si se hace que muchas personas pierdan sus citas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X