4 votos

donde y

¿Cómo se diferencian las siguientes expresiones con respecto al vector de $x$.

Creo que podría ser un poco conceptualmente confuso sobre lo que sucede cuando usted toma la derivada con respecto a un vector. Qué dimensiones debe terminar con? Para el problema, estoy tratando de resolver, creo que debo terminar para cada uno de estos derivados con los resultados de la derivada a ser $R^{1\times1}$.

  1. $\frac{d}{dx}(b^TAx)$

  2. $\frac{d}{dx}(x^TAb)$

  3. $\frac{d}{dx}(x^TAx)$

donde $b, x \in R^{n\times 1}$ $A \in R^{n\times n}$

También, si ayuda para este caso es simétrica.


Actualización:

Gracias a la motivación extra de Mike y joriki, creo que ahora se han resuelto.

  1. $\frac{d}{dx}(b^TAx) = Ab$

  2. $\frac{d}{dx}(x^TAb) = Ab$

  3. $\frac{d}{dx}(x^TAx) = \textbf{A}\textbf{x} + \textbf{A}^T\textbf{x}$

Pero si alguien quisiera ver el doble de lo que sería genial.

7voto

Did Puntos 1

Este es defender simultáneamente para algunos más riguroso notaciones y para una manera fácil de resolver estas preguntas mediante el uso tanto como sea posible las maravillas de álgebra lineal.

En primer lugar, si $U$ es una función definida en el $\mathbb R^n$ con valores en $\mathbb R$, la notación $\frac{d}{dx}U(x)$ es extraño al $n\geqslant2$ porque $\frac{d}{dx}$ generalmente denota el operador de la derivada aplicada a una función de$\mathbb R$$\mathbb R$. Por ejemplo, si $u$ se define en $\mathbb R$$u(x)=\mathrm e^{x^2}$, sé que $\frac{d}{dx}u(x)=2x\mathrm e^{x^2}$ pero si $U$ se define en $\mathbb R^n$$U(x)=\mathrm e^{\|x\|^2}$, no sé el significado de la notación $\frac{d}{dx}U(x)$ al $n\geqslant2$.

Aquí, uno busca el gradiente $\nabla U(x)$$U$$x$. En la tranquila términos, $\nabla U(x)$ es un vector en $\mathbb R^n$ pero en realidad $\nabla U(x)$ es una forma lineal definido en $\mathbb R^n$ ($\mathbb R^n$ es el espacio vectorial tangente del colector $\mathbb R^n$$x$). Rigurosamente hablando, $\nabla U(x):\mathbb R^n\to\mathbb R$ se define por el hecho de que, para cada vector de $v$$\mathbb R^n$, $$ \nabla U(x)(v)=\lim\limits_{h\to0}\frac1h(U(x+hv)-U(x)), $$ si el límite existe. De esta forma se define una función lineal $\nabla U(x):\mathbb R^n\to\mathbb R$ y la identificación de esta función con un elemento $w$ $\mathbb R^n$ llega a través de la identificación del espacio de la tangente del colector $\mathbb R^n$ $x$ con el espacio vectorial $\mathbb R^n$ a través de la elección de un vector de la base. Esta base $B$ define un producto escalar en $\mathbb R^n$ $(v_1,v_2)\mapsto v_1^Tv_2$ gracias a la descomposición de los $v_1$$v_2$$B$, y se obtiene la relación $$ \nabla U(x)(v)=w^Tv. $$ Un vector $w$ es a menudo denotado $w=\mathrm{grad}\ U(x)$ y el tanto $\nabla$ $\mathrm{grad}$ son pronunciado gradiente. Por lo tanto la escritura $v$ $w$ en base a la $B$$v=(v_i)_i$$w=\left(\frac{\partial U}{\partial x_i}(x)\right)_i$, se obtiene $$ \nabla U(x)(v)=w^Tv=\sum\limits_iw_iv_i=\sum\limits_i\frac{\partial U}{\partial x_i}(x)\ v_i. $$ Para resumir todo lo anterior:

  • Para calcular los $\nabla U(x)=w$ es escribir $U(x+hv)=U(x)+hw^Tv+o(h)$ por cada $v$ $\mathbb R^n$ al$h$$\mathbb R$$0$.
  • El hecho de que $\nabla U(x)=w$ es equivalente al hecho de que $\nabla U(x)(v)=w^Tv$ para todos los vectores $v$, que es equivalente al hecho de que $\dfrac{\partial U}{\partial x_i}(x)=w_i$ por cada $i$.

Vamos ahora a calcular el gradiente de sus ejemplos. Vamos a hacer un uso intensivo del hecho de que para cada una de las matrices de $C$ $D$ de dimensiones adecuadas, $(CD)^T=D^TC^T$ y el hecho de que $z^T=z$ por cada $1\times1$ matriz (también conocido como un número), pero de bastante mucho nada más. Aquí vamos.

  1. Si $U(x)=b^TAx$, $U(x+hv)-U(x)=h(b^TAv)=h(A^Tb)^Tv$ por lo tanto $\nabla U(x)=A^Tb$.

  2. Si $U(x)=x^TAb$, $U(x+hv)-U(x)=h(v^TAb)=h(Ab)^Tv$ por lo tanto $\nabla U(x)=Ab$.

  3. Si $U(x)=x^TAx$, $U(x+hv)-U(x)=h(v^TAx+x^TAv)+h^2v^TAv$ por lo tanto $\nabla U(x)(v)=v^TAx+x^TAv=(Ax)^Tv+(A^Tx)^Tv$ por lo tanto $\nabla U(x)=Ax+A^Tx=(A+A^T)x$.

Para transformar estas consideraciones en algunas fórmulas concretas, nos vamos a calcular las coordenadas de la gradiente en los casos 1. y 3. En el caso 1., uno se $$ \frac{\partial U}{\partial x_i}(x)=(A^Tb)_i=\sum\limits_j(A^T)_{ij}b_j=\sum\limits_jA_{ji}b_j, $$ y en el caso 3., $$ \frac{\partial U}{\partial x_i}(x)=((a+a^T)x)_i=\sum\limits_j(a+a^T)_{ij}x_j=\sum\limits_j(A_{ij}+A_{ji})x_j. $$

1voto

JiminyCricket Puntos 143

Una buena manera de conseguir una sensación para estas cosas (y asegúrese de que usted obtenga la respuesta correcta) es empezar el paso peatonal, escribe las expresiones en coordenadas formulario con sumas sobre índices, diferenciar y vuelva a escribir el resultado en forma de matriz. Que es el que las hace menos misterioso, y cuando lo he hecho un par de veces, se hace evidente cómo hacerlo sin necesidad de escribir.

[Actualización:]

En sus soluciones, números 2 y 3 son correctas (excepto el uso de la negrita, debe ser coherente en ambos lados, incluyendo la derivada).

Se puede ver que 1 y 2 no pueden ser ambas correctas porque $b^TAx$, la cual es simétrica (de ser sólo un número), es el mismo que $x^TA^Tb$, por lo que 2 implica que su derivada debe ser $A^Tb$. Sugiero volver a la coordenada de 1 y comprobar si has correctamente transformado la suma de la derivada en una matriz producto. Usted probablemente encontrará que la suma era sobre el mal índice y usted necesita tomar la transpuesta de a $A$ hacer los índices de salir a la derecha por una multiplicación de la matriz.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X