Estoy tratando de demostrar que cuando $f(x) =x^TBx$ entonces $f'(x) = (B + B^T)x$ . No he encontrado esta fórmula en Internet, pero al repasar los cálculos utilizando la notación de índices, esto es lo que se me ocurrió. Esto se simplificaría a $2Bx$ cuando $B$ es simétrica. La respuesta aceptada a esta discusión dice que la solución es en realidad $f'(x) = x^T(B + B^T)$ , repasando la prueba allí, veo cómo llegó a eso pero no veo dónde está el error en el mío entonces.
El montaje
- $x \in \mathbb{R^n}$ siempre es un vector columna
- $B \in \mathbb{R^{n \times n}}$ , $B$ puede no ser simétrico
Mi enfoque
Dejemos que $g(x)=x^TB$ y $h(x)=x$ entonces puedo escribir $f(x)=g(x)h(x)$ . Entonces
- $f(x) \in \mathbb{R}$
- $g(x) \in \mathbb{R^{1 \times n}}$
- $h(x) \in \mathbb{R^n}$
- $f'(x) \in \mathbb{R^n}$
- $g'(x) \in \mathbb{R^{n \times n}}$
- $h'(x) \in \mathbb{R^{n \times n}}$
He pasado por mí mismo por qué $g'(x) = B$ y $h'(x) = I_n$ Así que no voy a hablar de ellos aquí.
Entonces, utilizando la regla del producto obtengo:
$$f'(x) = g'(x)h(x) + g(x)h'(x)$$
El problema es que las dimensiones no cuadran. Obtengo $g'(x)h(x) = Bx \in \mathbb{R^{n}}$ lo cual es bueno. Sin embargo, también tengo $g(x)h'(x) = x^TBI_n = x^TB \in \mathbb{R^{1 \times n}}$ y que yo sepa no puedo sumar dos vectores de distinto tamaño.
Sé que la solución va a ser la transposición del segundo término, pero no consigo encontrar de dónde saldría esa transposición.
¿Por qué tengo que tomar la transposición del segundo término?
[Editar]: Por favor, no respondas con una prueba diferente. Lo que busco es entender dónde me equivoqué en el cálculo porque evidentemente hice un paso que era incorrecto y sin entender dónde está es probable que vuelva a cometer ese error.