Estoy tratando de calcular la derivada de $$(\mathbf{Y-X \beta})^T\mathbf{P}(\mathbf{Y-X \beta}) $$ donde $\mathbf{P}$ es una matriz definida positiva. Las dimensiones reales de cada elemento no se dan en la especificación de la pregunta, pero como se trata de minimizar $\beta$ para el análisis de regresión, creo que $\mathbf{X}$ es mxn, $\mathbf{\beta}\in \mathbf{R}^n$ y $\mathbf{Y}\in \mathbf{R}^m$ . En primer lugar, amplío la expresión,
$$(\mathbf{Y-X \beta})^T\mathbf{P}(\mathbf{Y-X \beta}) = (\mathbf{Y^TP-\beta^T\mathbf{X}^TP})(\mathbf{Y-X \beta}) = \mathbf{Y^TPY-Y^TPX\beta -\beta^TX^TPY+\beta^TX^TPX\beta} $$
Ahora tomo la derivada para wrt $\beta$ . Para el término final, estoy utilizando que es una forma cuadrática y creo que estoy asumiendo $\mathbf{X^TPX}$ es simétrica. Sólo estoy usando identidades en - https://en.wikipedia.org/wiki/Matrix_calculus De todos modos lo entiendo,
$$\mathbf{-Y^TPX-Y^TPX}+2\mathbf{\beta^TX^TPX} = -2\mathbf{Y^TPX+2\beta^TX^TPX}$$
Desde aquí, puedo equiparar a $0$ y tomar la transposición, para resolver $\beta$ (asumiendo que todo es invertible por ahora, no te preocupes).
$$\mathbf{\beta^TX^TPX=Y^TPX}\iff \mathbf{X^TPX\beta=X^TPY} \iff \beta=\mathbf{(X^TPX)^{-1}X^TPY}$$
Las soluciones lo resuelven de forma ligeramente diferente. Dijeron desde entonces, $(\mathbf{Y-X \beta})^T\mathbf{P}(\mathbf{Y-X \beta})$ ya es una forma cuadrática, podemos usarla para calcular la derivada como $$\mathbf{-X^T}2\mathbf{P(Y-X\beta})=-2\mathbf{X^TPY} + 2{\mathbf{X^TPX\beta}}$$ . Como puedes ver, esto es lo mismo que mi derivada, pero transpuesta. Por supuesto, una vez que transpongo para resolver para $\beta$ Pero no es así y obtenemos la misma solución final. Tengo dos preguntas.
-
¿Es el método que he hecho incorrecto, es decir, si la pregunta era sólo calcular la derivada lo he hecho mal. Si es así, ¿podría indicarme dónde he cometido el error?
-
Podría alguien recomendar alguna bibliografía/página web que explique el proceso que siguieron las soluciones para tomar la derivada al detectar que era una forma cuadrática.
¡Muchas gracias!