4 votos

Gradiente y hessiano de $x x^T$ por ejemplo $x$ , donde $x \in \mathbb{R}^{n \times 1}$ ,?

Pregunta: ¿Podemos encontrar el gradiente y el hessiano de $x x^T$ por ejemplo $x$ , donde $x \in \mathbb{R}^{n \times 1}$ ?

EDITAR: Si se puede, ¿se puede saber cómo calcular eso? Gracias.

3 votos

Sí, podemos. ${}$

1 votos

@Sobi Me has alegrado el día

0 votos

En realidad, ahora que lo pienso, ¿realmente quieres que el gradiente de $x x^T$ que es un $n \times n$ ¿Matriz?

3voto

rob Puntos 1459

Gradiente $$\frac{\partial \mathbf{Y}}{\partial x_i} = \begin{bmatrix} \frac{\partial y_{11}}{\partial x_i} & \frac{\partial y_{12}}{\partial x_i} & \cdots & \frac{\partial y_{1n}}{\partial x_i}\\ \frac{\partial y_{21}}{\partial x_i} & \frac{\partial y_{22}}{\partial x_i} & \cdots & \frac{\partial y_{2n}}{\partial x_i}\\ \vdots & \vdots & \ddots & \vdots\\ \frac{\partial y_{m1}}{\partial x_i} & \frac{\partial y_{m2}}{\partial x_i} & \cdots & \frac{\partial y_{mn}}{\partial x_i}\\ \end{bmatrix}.$$

Dejemos que $$\mathbf{Y} = \mathbf{xx^T} = \begin{bmatrix} x_1^2 & x_1x_2 & \ldots & x_1x_n \\ x_1x_2 & x_2^2 & \ldots & x_2x_n \\ \ldots &\ldots & \ldots & \ldots \\ x_nx_1 & x_nx_2 & \ldots & x_n^2 \\ \end{bmatrix}$$ Así que $$\frac{\partial \mathbf{xx^T}}{\partial x_i} = \mathbf{Z}_i + \mathbf{Z}_i^T \qquad i \in \lbrace 1 \ldots x \rbrace$$ donde $\mathbf{Z}_i$ es una matriz todo cero excepto el vector $x$ en su $i^{th}$ columna.

Hessian

La derivada de $\frac{\partial \mathbf{Z}_i}{\partial x_j}$ es una matriz todo cero excepto $1$ en su $(j,i)$ posición. Por simetría, la derivada de $\frac{\partial \mathbf{Z}_i^T}{\partial x_j}$ es una matriz totalmente nula, excepto $1$ en su $(i,j)$ posición. Esto significa que $$\frac{\partial \mathbf{xx^T}}{\partial x_i \partial x_j} = \mathbf{K}_{i,j} \qquad (i,j) \in \lbrace 1 \ldots x \rbrace$$ donde $\mathbf{K}_{i,j}$ es un $n \times n$ matriz que es todo cero excepto en las posiciones $(i,j)$ y $(j,i)$ . Tenga en cuenta que si $i = j$ , obtenemos un $2$ en el $i^{th}$ (o $j^{th}$ ).

0 votos

¡Gracias por la respuesta! Entonces, el gradiente es en realidad $\frac{\partial}{\partial \mathbf{x}} \mathbf{Y} = \mathbf{x} \otimes \mathbf{I} + \mathbf{I} \otimes \mathbf{x}$ También se podría decir que el hessiano es semidefinido positivo?

0 votos

De nada. Si la respuesta te ha resultado útil, puedes marcarla como "correcta" para que los demás sepan que ha sido útil :) y a qué te refieres con $\otimes$ ¿Es el producto de Kronecker? Y el hessiano no es necesariamente PSD.

0 votos

Sí, quería decir $\otimes$ como producto de Kronecker.

2voto

greg Puntos 156

Es muy fácil calcular estas cosas en notación de índice. $$\eqalign{ F_{ij} &= x_ix_j \cr G_{ijk} = \frac{\partial F_{ij}}{\partial x_k} &= x_i\delta_{jk} + x_j\delta_{ik} \cr H_{ijkl} = \frac{\partial^2F_{ij}}{\partial x_k\partial x_l} &= \delta_{il}\delta_{jk} + \delta_{ik}\delta_{jl} \cr }$$

0 votos

Gracias por tu respuesta, Greg. Esto parece interesante... Es $\delta_{ij} = 1$ si $i=j$ si no $\delta_{ij}=0$ ?

0 votos

En su notación, ¿el gradiente y el hessiano son tensores de tercer y cuarto orden, respectivamente? Debo admitir que tengo dificultades para entender los tensores :( . Espero que algún día pueda entender estos tensores (he aprendido de ti ..y el aprendizaje continúa.

0voto

P. Quinton Puntos 172

Esto es estándar Diferenciación de la matriz

El gradiente es $2x$ y el hessiano es $2 I$ .

Por cierto, asumo que quieres decir $x^T x$ desde $x x^T$ es una matriz y no tiene gradiente ni hessiano.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X