En este artículo de Wikipedia tienen esto que decir sobre el gradiente:
Si $m = 1$, $\mathbf{f}$ es un campo escalar y la matriz jacobiana se reduce a un vector fila de derivadas parciales de $\mathbf{f}$—es decir, el gradiente de $\mathbf{f}$.
Así como
El Jacobiano del gradiente de una función escalar de varias variables tiene un nombre especial: la matriz Hessiana, que en cierto sentido es la "segunda derivada" de la función en cuestión.
Así que intenté hacer los cálculos y me quedé atascado.
Si dejamos que $f: \mathbb{R}^n \to \mathbb{R}$, entonces $$Df = \begin{bmatrix} \frac{\partial f}{\partial x_1} & \dots & \frac{\partial f}{\partial x_n} \end{bmatrix} = \nabla f$$ Hasta aquí todo bien, pero cuando intento calcular la matriz jacobiana del gradiente obtengo $$D^2f = \begin{bmatrix} \frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_2 x_1} & \dots & \frac{\partial^2 f}{\partial x_n x_1} \\ \frac{\partial^2 f}{\partial x_1 x_2} & \frac{\partial^2 f}{\partial x_2^2} & \dots & \frac{\partial^2 f}{\partial x_n x_2} \\ \vdots & \vdots & \ddots & \vdots \\ \frac{\partial^2 f}{\partial x_1 x_n} & \frac{\partial^2 f}{\partial x_2 x_n} & \dots & \frac{\partial^2 f}{\partial x_n^2} \end{bmatrix}$$ Lo cual según este artículo, no es igual a la matriz Hessiana sino más bien su transpuesta, y por lo que puedo entender la Hessiana no es generalmente simétrica.
Así que tengo dos preguntas, ¿se considera generalmente al gradiente como un vector fila? ¿Y hice algo mal al calcular el Jacobiano del gradiente de $f$, o está incorrecto el artículo de Wikipedia?