11 votos

Regla del producto escalar-vectorial

Dejemos que $\mathbf F : \mathbb R^p \to \mathbb R^s$ y $\phi : \mathbb R^p \to \mathbb R$ sean funciones diferenciables. Sea la función $\mathbf G$ se definirá de la siguiente manera: $$\mathbf G : \mathbb R^p \to \mathbb R^s \qquad \mathbf G(\mathbf y) = \phi(\mathbf y)\mathbf F(\mathbf y)$$

Además, dejemos que $y_0$ sea un punto en $\mathbb R^p$ . Entonces el jacobiano de $\mathbf G$ y de $\mathbf F$ en $y_0$ , denotando respectivamente $D\mathbf G(y_0)$ y $D\mathbf F(y_0)$ son $s \times p$ mientras que el jacobiano de $\phi$ en $y_0$ , denotado como $D\phi(y_0)$ es un vector de filas $p$ entradas de longitud y, por lo tanto, puede convertirse en un gradiente: $$\nabla \phi(y_0) \doteq D\phi(y_0)^\top$$

Ahora la pregunta es, ¿cómo puedo expresar $D\mathbf G(y_0)$ en términos de los otros dos jacobianos? Intenté aplicar imprudentemente la regla del producto, $$D\mathbf g(y_0) \stackrel{?}{=} \phi(y_0) D\mathbf F(y_0) + D\phi(y_0) \mathbf F(y_0) $$ pero las dimensiones de las matrices no coinciden correctamente. ¿Qué estoy haciendo mal?

11voto

Chappers Puntos 20774

Hay dos formas de ver esto que lo solucionan: podemos usar índices, o podemos entender todo como mapas lineales y trabajarlo explícitamente.

  • En notación de índice, tenemos funciones $G_i = \phi(y) F_i(y)$ . Todos ellos son escalares, por lo que se aplica la regla del producto habitual para las funciones escalares: $$ \frac{\partial G_i}{\partial y_j} = \phi \frac{\partial F_i}{\partial y_j} + \frac{\partial \phi}{\partial y_j} F_i. $$ Desde $\phi$ es un escalar, para escribir la matriz correspondiente, podemos invertir el orden para poner el $j$ términos de la derecha, es decir $$ (DG)_{ij} = \phi (DF)_{ij} + F_i (\nabla\phi)_j = (\phi DF + F \otimes \nabla \phi)_{ij}, $$ $\otimes$ siendo el producto diádico $(A \otimes B)_{ij} = A_i B_j$ .

Abordando el problema de forma libre de coordenadas, la derivada $DG(y)$ es un mapa lineal $\mathbb{R}^p \to \mathbb{R}^s$ dada de forma única por $$ G(y+h) = G(y) + DG(y)(h) + o(\lVert h \rVert). $$ Escrito así, no importa cómo $h$ se incorpora siempre que la expresión termine en $\mathbb{R}^s$ . Se puede demostrar que la regla del producto (o un uso inteligente de la regla de la cadena) en este formalismo da $$ DG(y)(h) = [\phi(y)] DF(y)(h) + [D\phi(y)(h)] F(y), $$ donde los términos entre paréntesis son ambos escalares (y por lo tanto podemos empujarlos para terminar con todos los $h$ s a la derecha si lo deseamos).

Lo importante es entender que como la derivada es un mapa lineal, tiene que tener un argumento alimentado en alguna parte. Si se divide en términos que son alguna forma de productos de derivadas y partes de la función original, el argumento debe introducirse en las derivadas, no en las otras partes de la función (esta es una buena razón para pensar en funciones $\mathbb{R}^n \supset U \to \mathbb{R}^m$ ya que entonces el argumento de la función está restringido a un subconjunto, pero los vectores tangentes que introduces en la derivada no lo están.

7voto

florence Puntos 99

Dejemos que $F_1,...,F_s$ denotan los componentes de $F$ . Entonces $G_i = \phi F_i$ y así $$(DG)_{ij}=\frac{\partial G_i}{\partial x_j} = \frac{\partial \phi}{\partial x_j}F_i+\phi\frac{\partial F_i}{\partial x_j} = \frac{\partial \phi}{\partial x_j}F_i+\phi (DF)_{ij}$$ El $s\times p$ matriz $A$ tal que $A_{ij}=\frac{\partial \phi}{\partial x_j}F_i$ es igual a $F\nabla\phi$ donde aquí, $F$ se piensa en un $s$ -y el vector de columnas $\nabla \phi$ es un $p$ -vector de filas de dimensiones. Por lo tanto, tenemos $$DG = D(\phi F) = F\nabla \phi+\phi DF$$ Tenga en cuenta que en el lado derecho, el primer producto es la multiplicación de la matriz, y el segundo es la multiplicación escalar de la matriz $DF$ por la función escalar $\phi$ .

0 votos

Ah, así que básicamente el orden en que tomo la multiplicación de la matriz se invierte de alguna manera (con respecto a lo que he escrito en la pregunta) para que el gradiente de la función escalar se deslice después de la función vectorial. ¿Hay alguna razón en particular de por qué sería eso?

0 votos

Eso es lo que tiene que pasar para que las dimensiones funcionen.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X