Dada una función diferenciable $$F:M_{n\times n}(\mathbb{R})\to\mathbb{R}$$ ¿Cómo debo interpretar su aproximación de primer orden?
La derivada de una función de valor real de una matriz es una función de valor matricial de una matriz. Así que lo que hice fue tratar esta función como si fuera una función $$F:\mathbb{R}^{n\times n}\to\mathbb{R}$$ y formó lo que espero sea la aproximación de primer orden: $$F(X+H)\approx F(X) + \text{tr}(F'(X)H^T)$$
¿Es esto correcto? ¿La aproximación de segundo orden contendría entonces un tensor de 3? Aunque interpretándolo como una función vectorial sólo sería una matriz (el hessiano).
¿Cuál es entonces la diferencia entre los dominios $M_{n\times n}(\mathbb{R})$ y $\mathbb{R}^{n\times n}$ . Son isomorfos como espacios vectoriales, por lo que debería pensar en $M_{n\times n}(\mathbb{R})$ como sólo $\mathbb{R}^{n\times n}$ con alguna estructura multiplicativa extra?
¿Dónde puedo ir para aprender más sobre este tipo de cosas?
Actualización
Ok, así que pasé algún tiempo mirando la respuesta de Aloizio y aquí está mi entendimiento. Aloizio dice que la derivada es una función lineal continua de $\mathbb{E}\mapsto\mathbb{F}$ y eso me hizo darme cuenta de que para las funciones $\mathbb{R}^n\mapsto\mathbb{R}$ El gradiente no es la derivada, la primera derivada es la función que calcula el producto punto del gradiente con un vector. Esto es confuso ya que parece haber una tendencia en las matemáticas a confundir el mapa lineal de las derivadas parciales con la propia derivada.
Si miramos el determinante como ejemplo, calculamos $$\det(A+H) = \det(A) + \text{tr}(Adj_AH) + \epsilon(A,H)$$ donde $Adj_A$ es la matriz adyacente de $A$ . Y por tanto la derivada del determinante en $A$ es $$\text{tr}(Adj_A\;\cdot\;)$$ que, por supuesto, es continua y lineal.
Ahora, para una función general diferenciable $M_{n\times n} (\mathbb{R})\mapsto\mathbb{R}$ . Vemos que $\text{tr}(Adj_A\;\cdot\;)$ no es más que una versión apilada de filas del producto punto, y por lo tanto la distinción entre $M_{n\times n} (\mathbb{R})\mapsto\mathbb{R}$ y $\mathbb{R}^{n\times n}\mapsto\mathbb{R}$ parece más bien cosmético, y deberíamos esperar que todas las primeras derivadas adopten la forma $\text{tr}(B\;\cdot\;)$ para $B$ la matriz de derivadas parciales. También imagino que hay alguna manera de escribir la segunda derivada como una función que involucra un 3-tensor, pero no sé nada acerca de los tensores, así que no podía decir con seguridad.
0 votos
También he actualizado la respuesta.