Comience con la descomposición SVD de a x:
x=U\Sigma V^T
A continuación, \|x\|_*=tr(\sqrt{x^Tx})=tr(\sqrt{(U\Sigma V^T)^T(U\Sigma V^T)})
\Rightarrow \|x\|_*=tr(\sqrt{V\Sigma U^T U\Sigma V^T})=tr(\sqrt{V\Sigma^2V^T})
Por la circularidad de la traza:
\Rightarrow \|x\|_*=tr(\sqrt{V^TV\Sigma^2})=tr(\sqrt{V^TV\Sigma^2})=tr(\sqrt{\Sigma^2})=tr(|\Sigma|)
donde |\Sigma| es la matriz del elemento sabio de los valores absolutos de \Sigma.
Por lo tanto nuclear norma también puede ser definida como la suma de los valores absolutos de la descomposición de valor singular de la matriz de entrada.
Ahora, tenga en cuenta que la función valor absoluto no es derivable en cada punto de su dominio, pero usted puede encontrar un subgradiente.
\frac{\partial \|x\|_*}{\partial x}=\frac{\partial tr(|\Sigma|)}{\partial x}=\frac{ tr(\partial|\Sigma|)}{\partial x}
Usted debe encontrar a \partial|\Sigma|. Desde \Sigma es diagonal, el subdifferential conjunto de |\Sigma|: \partial|\Sigma|=|\Sigma|\Sigma^{-1}\partial\Sigma, ahora tenemos:
\frac{\partial \|x\|_*}{\partial x}=\frac{ tr(|\Sigma|\Sigma^{-1}\partial\Sigma)}{\partial x} (I)
Así que debemos encontrar el \partial\Sigma.
x=U\Sigma V^T, por lo tanto:
\partial x=\partial U\Sigma V^T+U\partial\Sigma V^T+U\Sigma\partial V^T
Por lo tanto:
U\partial\Sigma V^T=\partial x-\partial U\Sigma V^T-U\Sigma\partial V^T
\Rightarrow U^TU\partial\Sigma V^TV=U^T\partial xV-U^T\partial U\Sigma V^TV-U^TU\Sigma\partial V^TV
\Rightarrow U^TU\partial\Sigma V^TV=U^T\partial xV-U^T\partial U\Sigma V^TV-U^TU\Sigma\partial V^TV
\Rightarrow \partial\Sigma =U^T\partial xV-U^T\partial U\Sigma - \Sigma\partial V^TV
Se puede demostrar que los -U^T\partial U\Sigma - \Sigma\partial V^TV=0 (Sugerencia: diagonal antisimétrica y matrices, me salto la prueba aquí.), por lo tanto:
\partial\Sigma =U^T\partial xV
Por la sustitución en (I):
\frac{\partial \|x\|_*}{\partial x}=\frac{ tr(|\Sigma|\Sigma^{-1} \partial\Sigma)}{\partial x}=\frac{ tr(|\Sigma|\Sigma^{-1}U^T\partial xV)}{\partial x}=\frac{ tr(V|\Sigma|\Sigma^{-1}U^T\partial x)}{\partial x}=(V|\Sigma|\Sigma^{-1}U^T)^T
Por lo tanto, usted puede utilizar U\Sigma^{-1}|\Sigma|V^T como el subgradiente.
Espero que esto ayude!
EDIT: Por \Sigma^{-1}, me refiero a la de Moore-Penrose de pseudo-inversa de a \Sigma, por lo tanto si sign(\Sigma) es el elemento sabio signo de las componentes de la diagonal de a \Sigma, (cualquier valor entre -1 y 1 para los ceros en la diagonal), entonces el subdifferential es: U sign(\Sigma)V^T