Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

3 votos

Definición de derivación matricial

Estoy intentando calcular una derivación matemática, pero es evidente que me estoy perdiendo algo.

Preciso que sólo he aprendido la definición "formal" de derivación en el caso 1D, y no estoy familiarizado con los espacios de Banach ni con este grado de formalismo.

Quiero calcular bTAbb donde A es (k,k) y b es (k,1) .

Esto es lo que he probado f(b+h)=(b+h)TA(b+h)=bTAb+hTAb+bTAh+hTAh=f(b)+(bTATh)T+bTAh+o(||h||)=f(b)+bTATh+bTAh+o(||h||) 1D : I take the transpose=f(b)+(bTAT+bTA)h+o(||h||)=f(b)+bT(AT+A)h+o(||h||)f(b+h)f(b)=bT(AT+A)h+o(||h||) Utilizaré una impropia (división por h ), por analogía con el caso 1D f(b+h)f(b)h=bT(AT+A)+o(||1||)f(b)b=bT(AT+A)

Pero he encontrado en varios cursos (por ejemplo Aquí y Aquí ) que se supone que debo encontrar (A+AT)b .

Así que supongo que mi idea no es "demasiado mala", pero me falta un elemento conceptual (seguramente relacionado con mi derivación incorrecta) porque obtengo la dimensión equivocada.

Así que

  • ¿Puede alguien corregirme?
  • ¿Puede alguien explicarme la intuición de por qué mi dimensión no es la correcta?

Gracias

3voto

heisthedon Puntos 1042

Consideremos el caso en que b es una matriz.

Utilice la Producto interior de Frobenius (:) para escribir la función escalar como

f=b:Ab y tomar su diferencial

df=db:Ab+b:Adb=Ab:db+ATb:db=(A+AT)b:db Desde df=(fb:db), el gradiente es igual a fb=(A+AT)b Este resultado es válido cuando b es cualquier (k×n) matriz.
En particular, es válida cuando (n=1) es decir, cuando b es un vector.

1voto

Jonas Puntos 329

Convengamos en que los vectores se escriben como columnas.

Desde F(b)=bTAb es una función de Rk a R la derivada (si existe) será una transformación lineal T:RkL(Rk,R) (para cada bRk la imagen T(b) es una transformación lineal de Rk a R ). El mapa T se define exigiendo que lim (y si existe es único). Así, en su caso obtenemos T(b)h=b^T(A^T+A)h y solemos escribir simplemente T(b)=b^T(A^T+A), pero aún así debemos interpretarla como una transformación lineal. Si escribimos T(b)=(A^T+A)b estaríamos pensando en los vectores como filas y entonces escribiríamos T(b)h=(A^T+A)b\cdot h .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X