Pregunta: ¿Podemos encontrar el gradiente y el hessiano de $x x^T$ por ejemplo $x$ , donde $x \in \mathbb{R}^{n \times 1}$ ?
EDITAR: Si se puede, ¿se puede saber cómo calcular eso? Gracias.
Pregunta: ¿Podemos encontrar el gradiente y el hessiano de $x x^T$ por ejemplo $x$ , donde $x \in \mathbb{R}^{n \times 1}$ ?
EDITAR: Si se puede, ¿se puede saber cómo calcular eso? Gracias.
Gradiente $$\frac{\partial \mathbf{Y}}{\partial x_i} = \begin{bmatrix} \frac{\partial y_{11}}{\partial x_i} & \frac{\partial y_{12}}{\partial x_i} & \cdots & \frac{\partial y_{1n}}{\partial x_i}\\ \frac{\partial y_{21}}{\partial x_i} & \frac{\partial y_{22}}{\partial x_i} & \cdots & \frac{\partial y_{2n}}{\partial x_i}\\ \vdots & \vdots & \ddots & \vdots\\ \frac{\partial y_{m1}}{\partial x_i} & \frac{\partial y_{m2}}{\partial x_i} & \cdots & \frac{\partial y_{mn}}{\partial x_i}\\ \end{bmatrix}.$$
Dejemos que $$\mathbf{Y} = \mathbf{xx^T} = \begin{bmatrix} x_1^2 & x_1x_2 & \ldots & x_1x_n \\ x_1x_2 & x_2^2 & \ldots & x_2x_n \\ \ldots &\ldots & \ldots & \ldots \\ x_nx_1 & x_nx_2 & \ldots & x_n^2 \\ \end{bmatrix}$$ Así que $$\frac{\partial \mathbf{xx^T}}{\partial x_i} = \mathbf{Z}_i + \mathbf{Z}_i^T \qquad i \in \lbrace 1 \ldots x \rbrace$$ donde $\mathbf{Z}_i$ es una matriz todo cero excepto el vector $x$ en su $i^{th}$ columna.
Hessian
La derivada de $\frac{\partial \mathbf{Z}_i}{\partial x_j}$ es una matriz todo cero excepto $1$ en su $(j,i)$ posición. Por simetría, la derivada de $\frac{\partial \mathbf{Z}_i^T}{\partial x_j}$ es una matriz totalmente nula, excepto $1$ en su $(i,j)$ posición. Esto significa que $$\frac{\partial \mathbf{xx^T}}{\partial x_i \partial x_j} = \mathbf{K}_{i,j} \qquad (i,j) \in \lbrace 1 \ldots x \rbrace$$ donde $\mathbf{K}_{i,j}$ es un $n \times n$ matriz que es todo cero excepto en las posiciones $(i,j)$ y $(j,i)$ . Tenga en cuenta que si $i = j$ , obtenemos un $2$ en el $i^{th}$ (o $j^{th}$ ).
¡Gracias por la respuesta! Entonces, el gradiente es en realidad $\frac{\partial}{\partial \mathbf{x}} \mathbf{Y} = \mathbf{x} \otimes \mathbf{I} + \mathbf{I} \otimes \mathbf{x}$ También se podría decir que el hessiano es semidefinido positivo?
De nada. Si la respuesta te ha resultado útil, puedes marcarla como "correcta" para que los demás sepan que ha sido útil :) y a qué te refieres con $\otimes$ ¿Es el producto de Kronecker? Y el hessiano no es necesariamente PSD.
Gracias por tu respuesta, Greg. Esto parece interesante... Es $\delta_{ij} = 1$ si $i=j$ si no $\delta_{ij}=0$ ?
Esto es estándar Diferenciación de la matriz
El gradiente es $2x$ y el hessiano es $2 I$ .
Por cierto, asumo que quieres decir $x^T x$ desde $x x^T$ es una matriz y no tiene gradiente ni hessiano.
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.
3 votos
Sí, podemos. ${}$
1 votos
@Sobi Me has alegrado el día
0 votos
En realidad, ahora que lo pienso, ¿realmente quieres que el gradiente de $x x^T$ que es un $n \times n$ ¿Matriz?
0 votos
Sí, si es posible.
0 votos
Mis disculpas, en ese caso el primer comentario es injustificado por mi parte.