Sin término de regularización para la unidad de sesgo en la red neuronal

Question

Sin término de regularización para la unidad de sesgo en la red neuronal

Preguntado el 22 de Mayo, 2015: Cuando se hizo la pregunta
16340 visitas: Cuantas visitas ha tenido la pregunta
3 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

De acuerdo con este tutorial sobre aprendizaje profundo , la disminución de peso (regularización) generalmente no se aplica a los términos de sesgo b ¿por qué?

¿Cuál es el significado (intuición) detrás de esto?

Preguntado el 22 de Mayo, 2015 por suzanshakya

Answer 1

3 Respuestas

Answer 2

34voto

John Richardson Puntos 1197

El sobreajuste generalmente requiere que la salida del modelo sea sensible a pequeños cambios en los datos de entrada (es decir, para interpolar exactamente los valores objetivo, tiende a necesitar mucha curvatura en la función ajustada). Los parámetros de sesgo no contribuyen a la curvatura del modelo, por lo que normalmente no tiene mucho sentido regularizarlos también.

Respondido el 18 de Agosto, 2015 por John Richardson (1197 Puntos )

Answer 3

7voto

user46417 Puntos 21

La motivación detrás de L2 (o L1) es que al restringir los pesos, restringir la red, es menos probable que se sobreajuste. Tiene poco sentido restringir los pesos de los sesgos, ya que los sesgos son fijos (por ejemplo, b = 1), por lo que funcionan como intercepciones de neuronas, lo que tiene sentido para tener una mayor flexibilidad.

Respondido el 23 de Mayo, 2015 por user46417 (21 Puntos )

Answer 4

0voto

Jeff Hengesbach Puntos 1639

El tutorial dice que "la aplicación de la disminución de peso a las unidades de sesgo generalmente hace solo una pequeña diferencia en la red final", por lo que si no ayuda, puede dejar de hacerlo para eliminar un hiperparámetro. Si cree que regularizar el desplazamiento ayudaría en su configuración, valídelo de forma cruzada; no hay nada de malo en intentarlo.

Respondido el 23 de Mayo, 2015 por Jeff Hengesbach (1639 Puntos )

Sin término de regularización para la unidad de sesgo en la red neuronal

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Sin término de regularización para la unidad de sesgo en la red neuronal

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: