24 votos

Convenciones de fila y columna del gradiente y la matriz jacobiana

Digamos que $f$ es una función escalar de $\mathbb{R}^n \to \mathbb{R}$. Cuando aprendí sobre el gradiente $\nabla f(\mathbf{x}) siempre lo pensé como un vector columna en el mismo espacio que $\mathbf{x}$. De esa manera, el producto punto $\nabla f \cdot \mathbf{v}$ da la derivada direccional en la dirección de $\mathbf{v}.

Todas las definiciones que puedo encontrar de la Jacobiana de $\mathbf{y} = \psi(\mathbf{x})$ sin embargo lo definen como:

\begin{bmatrix} \frac{\partial y_1}{\partial x_1} & \frac{\partial y_1}{\partial x_2} & \cdots & \frac{\partial y_1}{\partial x_n}\\ \frac{\partial y_2}{\partial x_1} & \frac{\partial y_2}{\partial x_2} & \cdots & \frac{\partial y_2}{\partial x_n}\\ \vdots & \vdots \\ \frac{\partial y_m}{\partial x_1} & \frac{\partial y_m}{\partial x_2} & \cdots & \frac{\partial y_m}{\partial x_n}\\ \end{bmatrix}

Pero esto haría que $\nabla f$ sea un vector de fila, lo cual significaría que la derivada direccional ya no es $\nabla f \cdot \mathbf{v}.

¿Cuál es la manera correcta? ¿Cuáles son las consecuencias si escribo la Jacobiana de manera opuesta por accidente? He encontrado algunas preguntas similares aquí pero ninguna que responda directamente mi pregunta. Todavía estoy aprendiendo esto así que por favor explique en términos simples :)

27voto

Jan D. Puntos 316

En general, la derivada de una función $f : \mathbb{R}^n \to \mathbb{R}^m$ en un punto $p \in \mathbb{R}^n$, si existe, es la única transformación lineal $Df(p) \in L(\mathbb{R}^n,\mathbb{R}^m)$ tal que $$ \lim_{h \to 0} \frac{\|f(p+h)-f(p)-Df(p)h\|}{\|h\|} = 0; $$ la matriz de $Df(p)$ con respecto a las bases estándar ortogonales de $\mathbb{R}^n$ y $\mathbb{R}^m, llamada la matriz Jacobiana de $f$ en $p$, por lo tanto pertenece a $M_{m \times n}(\mathbb{R})$.

Ahora, supongamos que $m=1$, entonces $f : \mathbb{R}^n \to \mathbb{R}$. Entonces, si $f$ es diferenciable en $p$, $Df(p) \in L(\mathbb{R}^n,\mathbb{R}) = (\mathbb{R}^n)^\ast$ es un funcional y, por lo tanto, la matriz Jacobiana, como señalaste, pertenece a $M_{1 \times n}(\mathbb{R})$, es decir, es un vector fila. Sin embargo, por el teorema de representación de Riesz, $\mathbb{R}^n \cong (\mathbb{R}^n)^\ast$ a través del mapa que envía un vector $x \in \mathbb{R}^n$ al funcional $y \mapsto \left\langle y,x \right\rangle$. Por lo tanto, si $f$ es diferenciable en $p$, entonces la gradiente de $f$ en $p$ es el único vector (¡columna!) $\nabla f(p) \in \mathbb{R}^n$ tal que $$ \forall h \in \mathbb{R}^n, \quad Df(p)h = \left\langle \nabla f(p),h\right\rangle; $$ en particular, si desempacas las definiciones, descubrirás que la matriz Jacobiana de $f$ en $p$ es precisamente $\nabla f(p)^T$.

2voto

ntropy Puntos 515

Imagina escribir $\nabla f \cdot \mathbf{v}$. Tomarías la transpuesta de $\nabla f$ y la colocarías al lado de $\mathbf{v}$ para llevar a cabo el producto punto. Por lo tanto, realmente, $\nabla f$ es, y debería ser pensado como, un vector fila. En otras palabras, estás completamente en lo correcto. De hecho, dependiendo de cómo lo veas, es una convención de la mayoría de los libros de cálculo multivariable que escriben gradientes como vectores columna. Supongo que debería mencionar la forma elegante y diferencial-geométrica de decir esto es que el gradiente de una función escalar es un vector covariante, y a pesar de lo informal con la que lo dije, esta es en realidad la comprensión detrás del formalismo del gradiente y sus generalizaciones superiores a las variedades.

Podría ayudarte un poco mirar el teorema de representación de Riesz, o la notación bra-ket en mecánica cuántica.

0voto

Brady Trainor Puntos 849

EDITAR: Eh, algo está mal, tal vez debería tener $Dy_i$ en la matriz de abajo, perdón.

Aquí hay quizás un par de formas más de verlo. Tal vez esto debería ser un comentario para el OP, pero no estoy seguro de cómo comentar.

$$Jac({\bf y}) =\begin{bmatrix} \nabla y_1\\ \vdots\\ \nabla y_m \end{bmatrix} =\begin{bmatrix} {\partial\over\partial x_1}{\bf y}\cdots{\partial\over\partial x_n}{\bf y} \end{bmatrix} $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X