Estoy tratando de analizar problemas de optimización de la forma $$\text{Minimize: }||A - XY||^{2}_{F}$$ donde $A$ es de tamaño [m x n], $X$ es de tamaño [m x k], $Y$ es de tamaño [k x n], $k\le min(m,n)$ y $A$ , $X$ y $Y$ contienen sólo números reales. Se sabe que en el caso general este problema no es convexo, pero varias variantes del mismo sí lo son (el Análisis de Componentes Principales puede formularse así, por ejemplo). Mi pregunta se refiere a la formulación de la matriz hessiana de este tipo de sistema.
Utilizando el libro de cocina de matrices y otras referencias en línea, he calculado el hessiano de la siguiente manera $$H(f(X,Y)) = \left( \begin{array}{ccc} -2YY^{T} & -2A + 4XY \\ -2A + 4XY & -2X^{T}X \end{array} \right)$$ con $f(X,Y) = ||A - XY||^{2}_{F}$ . Estos son los pasos que utilicé para llegar a esta forma. $$\frac{\partial f}{\partial X} = -2(A - XY)Y^{T}, \frac{\partial f}{\partial Y} = -2X^{T}(A - XY) \\\frac{\partial^{2} f}{\partial X^{2}} = -2YY^{T}, \frac{\partial^{2} f}{\partial Y^{2}} = -2X^{T}X\\\frac{\partial^{2} f}{\partial X \partial Y} = -2A + 4XY, \frac{\partial^{2} f}{\partial Y \partial X} = -2A + 4XY$$
Mi primera pregunta es si esto es correcto o no (estoy moderadamente seguro de que los parciales en términos de sólo X o Y son correctos, pero mucho menos seguro en los otros). Mi segunda pregunta es si lo anterior es correcto, ¿significa eso que la matriz hessiana es indefinida cuando $A$ no es cuadrado? Parece que es así porque cuando $A$ es rectangular $-2YY^{T}$ y $-2X^{T}X$ son de diferentes dimensiones, lo que hace que el hessiano sea una matriz de tamaño $\left( \begin{array}{ccc} [m \times m] & [m \times n] \\ [m \times n] & [n \times n] \end{array} \right)$ Pero soy relativamente nuevo en los conceptos del cálculo matricial, así que no sé si me he perdido algo (por ejemplo, ¿se supone que uno de los parciales simétricos está transpuesto?).