Esta es una discusión un poco larga, así que por favor tengan paciencia conmigo. Hay un teorema que siempre me ha resultado curioso desde un punto de vista intuitivo y que ha sido pasado por alto en la mayoría de los libros de texto que he leído. Citando a Wikipedia el teorema es:
El gradiente de una función en un punto es perpendicular al conjunto de niveles de $f$ en ese momento.
Entiendo la prueba del artículo de Wikipedia, que es la forma estándar de ver las cosas, pero veo la prueba como algo mágico. Da una razón simbólica de por qué el teorema es cierto sin dar mucha intuición geométrica.
El gradiente da la dirección del mayor incremento, por lo que tiene sentido que una curva perpendicular sea constante. Por desgracia, esto parece ser un razonamiento al revés. Habiendo notado ya que el gradiente es la dirección de mayor incremento, podemos deducir que ir en una dirección perpendicular a él sería el incremento más lento. Pero no podemos razonar que este incremento más lento sea cero ni podemos argumentar que ir en una dirección perpendicular a una dirección constante nos daría una dirección de mayor incremento.
También agradecería alguna conexión de esta intuición con Multiplicadores de Lagrange que es otro teorema algo mágico para mí. Lo entiendo porque el álgebra funciona pero ¿qué pasa geométricamente?
Por último, ¿qué dice esto intuitivamente sobre la generalización en la que buscamos: maximizar $f(x,y)$ donde $g(x,y) > c$ .
Siempre he luchado por encontrar el modelo interno correcto que encapsule estas ideas.