2 votos

Cálculo matricial: c(2xTDc+cTc)=2DTx+2cc(2xTDc+cTc)=2DTx+2c ?

En un ejemplo de análisis de componentes principales, mi libro de texto utiliza el cálculo vectorial para hacer lo siguiente:

c(2xTDc+cTc)=0c(2xTDc+cTc)=0

2DTx+2c=02DTx+2c=0

c=DTxc=DTx

Dónde cc es el gradiente con respecto a cc , DRn×l , cRl y las columnas de D son ortogonales entre sí.

Tengo las siguientes preguntas:

  1. ¿Cómo llegaron los autores de xTDc a DTx ? No he estudiado cálculo matricial, pero supongo que cc=I ? ¿Qué pasa con xTD a DTx ?

  2. ¿Cómo pasaron los autores de cTc a 2c ? He encontrado lo siguiente en Diferenciación de matrices por Randal J. Barnes:


enter image description here


Si suponemos que A=I ¿no es esto lo que buscamos? Pero eso no nos dejaría con 2cT en lugar de 2c ?

Agradecería mucho que la gente se tomara la molestia de aclararlo.

2voto

Jackozee Hakkiuz Puntos 33

Existen (desgraciadamente) diferentes convenciones en el cálculo matricial. La más común es cc Sin embargo, en su ejemplo la convención es ccT Teniendo esto en cuenta, realizamos el cálculo cT(2xTDc+cTc)=0cT(2cTDTx+cTc)=02cTcTDTx+cT(cTc)=02DTx+cTcTc+cTccT=02DTx+c+cTccT=02DTx+2c=0

Ahora, para ir de (5) a (6) tenemos que demostrar que cTccT=c .

Podemos verlo utilizando la notación de índices. Aquí, c tiene un índice superior, y cT tiene un índice más bajo. Están relacionados por ci=δij(cT)j y (cT)i=δijcj (donde δ es el delta de kronecker).

Así que tenemos (cTccT)j=(cT)ici(cT)j=(cT)i(cT)kδki(cT)j=(cT)i(cT)k(cT)jδki=(cT)iδjkδki=(cT)iδji=cj

Y hemos terminado.

0voto

Pierre Lebeaupin Puntos 729

Se puede definir el gradiente f de una función escalar (agradable) f como la única función con valor vectorial tal que f(x+v)=f(x)+f(x)Tv+o(|v|)(|v|0) A partir de esto, se pueden demostrar los siguientes resultados básicos-

  1. Si f(x) es un mapa lineal dado por la multiplicación de matrices f(x)=Ax entonces su gradiente es constante en x con valor f(x)=AT .
  2. Si f(x)=xTAx entonces f(x)=(AT+A)x .

Yo diría que son buenos ejercicios si no has trabajado mucho con derivados. Estos juntos dan el resultado.

Una observación sobre el resultado que has encontrado en el libro de Barnes: él utiliza una convención diferente, f(x+v)=f(x)+˜f(x)v+o(|v|) y éstas están, por supuesto, relacionadas por transposición de matrices. Pero debes tener en cuenta qué convención estás utilizando cuando consultes otros recursos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X