1 votos

Cómo representar una derivada de una función que tiene más de 2 entradas con valor vectorial

He estado repasando la teoría que hay detrás del aprendizaje profundo, lo que me ha obligado a aprender algo de cálculo vectorial y se me ha ocurrido cómo se puede encontrar la derivada de una función respecto a una función que tiene más de 2 entradas con valor vectorial?

Para una función con que tiene una entrada con valor de 1 vector $f(\mathbf{x})$ podríamos simplemente tomar la derivada con respecto a cada elemento del vector $\mathbf{x}$ lo que da como resultado el vector gradiente:

$$\nabla f_{\mathbf{x}} = \begin{bmatrix} \frac{\delta f(\mathbf{x})}{\delta x_1} \\ \vdots \\ \frac{\delta f(\mathbf{x})}{\delta x_n}\end{bmatrix}$$

Para una función con que tiene una entrada con valor de 2 vectores $g(\mathbf{x}, \mathbf{y})$ Podría tomar encontrar el vector de gradiente con respecto a $g$ para $\mathbf{x}$ y $\mathbf{y}$ luego tomar el producto exterior (si mi entendimiento es correcto, por favor corríjanme si me equivoco) dando como resultado: $$(\nabla g_{\mathbf{x}})^T(\nabla g_{\mathbf{y}})$$ (No sé con qué símbolo se representa el producto exterior). Pero el resultado de esto debería ser un n x m matriz dimensional donde $\mathbf{x} \in \mathbf{R}^{n} $ y $\mathbf{y} \in \mathbf{R}^m$ .

Entonces, si lo anterior es correcto, ¿cómo se puede generalizar esto a una función de valor vectorial de k ¿vectores de entrada?

0voto

Bernard Wojcik Puntos 372

Se trata de una función con dominio $\mathbb {R}^n \times \mathbb {R}^m$ pero esto es isomorfo a $\mathbb R^{n+m}$ por lo que se puede pensar en una función con dos argumentos vectoriales como una función de un argumento con más componentes. El isomorfismo es $((x_1,...,x_n),(y_1,...,y_m))\mapsto (x_1,...,x_n,y_1,...,y_m)$

La extensión al caso de $k$ Los argumentos vectoriales se consiguen mediante el mismo proceso de "quitar los paréntesis".

0 votos

¿Podría darme un ejemplo?

0 votos

Si $\mathrm {x}=(x_1,x_2)$ y $\mathrm {y}=(y_1,y_2)$ entonces deja que $f(x,y)=\mathrm {x}+\mathrm {y}= (x_1,x_2)+(y_1,y_2)=(x_1+x_2,y_1+y_2)$ pero esto es efectivamente lo mismo que la función de cuatro números reales $g(z_1,z_2,z_3,z_4)=(z_1+z_2,z_3+z_4)$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X