Entiendo que la función "aplasta" un espacio vectorial real entre los valores 0 y 1.
Sin embargo, no veo qué tiene esto que ver con la función "max", o por qué eso la convierte en una versión "más suave" de la función max.
Entiendo que la función "aplasta" un espacio vectorial real entre los valores 0 y 1.
Sin embargo, no veo qué tiene esto que ver con la función "max", o por qué eso la convierte en una versión "más suave" de la función max.
Siempre pensé que se llamaba softmax porque es diferenciable ("suave") en todos los puntos para todos los elementos del vector de entrada. Esta explicación sería análoga a lo que hace que la función softplus ,$f(x) = \ln(1 + e^x)$, la versión "suave" de$f(x) = \max(0, x)$
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.