2 votos

Una cuestión geométrica sobre la conmutatividad de productos internos con matrices simétricas.

He estado intentando (sin éxito) entender gráficamente por qué, si $S$ es una matriz simétrica, y tengo dos vectores aleatorios $\vec{a}$ y $\vec{b}$ entonces:

$$\vec{a}^TS\vec{b}=\vec{b}^TS\vec{a}$$

Sé que podría demostrar algebraicamente lo anterior simplemente tomando la transposición de la cosa entera, y puesto que la transposición de una matriz simétrica es sólo la propia matriz diagonal, y la transposición de un número es sólo ese número, entonces:

$$\vec{a}^TS\vec{b}=\vec{b}^TS^T\vec{a}=\vec{b}^TS\vec{a}$$


Si aceptamos la definición computacional del producto punto, demostrarlo es aún más fácil.

Sea $a_0,a_1 ...$ sean los componentes de $\vec{a}$ a lo largo de los vectores propios de la matriz simétrica, que es una transformación ortoescalar. Es decir, escala el espacio en direcciones ortogonales, en las direcciones de sus vectores propios, pero no los gira.

Además $b_0, b_1...$ sean los componentes de $\vec{b}$ a lo largo de los vectores propios de $S$ .

Por último $\lambda_0, \lambda_1 ...$ sean las entradas diagonales de $S$ . Entonces...

$\vec{a}^TS\vec{b}=a_0\lambda_0b_0 + a_1\lambda_1b_1 + a_2\lambda_2b_2+...$

...mientras

$\vec{b}^TS\vec{a}=b_0\lambda_0a_0 + b_1\lambda_1a_1 + b_2\lambda_2a_2+...$

...que obviamente son exactamente lo mismo.


Así que, computacionalmente, funciona. Pero estoy tratando de ganar algo de intuición gráfica.

Pensando en esto gráficamente, $S$ es la matriz simétrica, que escala el espacio en direcciones ortogonales por sus valores propios.

El producto interior de dos vectores es la magnitud de la proyección de un vector sobre el otro multiplicada por la magnitud del otro.

He aquí una demostración gráfica de lo que digo. Hice los vectores propios de $S$ punto en las direcciones cartesianas, para simplificar. Es decir, en este caso, $S$ es una matriz diagonal, por lo que en las imágenes la he denotado con una $D$ .

Las barras dobles alrededor de los vectores significan "la magnitud de", y las flechas dobles significan "la proyección de (el vector a la izquierda de las flechas dobles) sobre (el vector a la derecha de las flechas dobles)".

enter image description here

enter image description here

enter image description here

enter image description here

¿Puede alguien intuitivamente ¿ves por qué los dos serían iguales? Yo no puedo, ¡y me preocupa mucho!

1voto

Erich Douglass Puntos 21714

La razón puede verse esencialmente a través del teorema espectral. Recordemos en primer lugar que una matriz $A$ es diagonalizable si se puede escribir como $A = SDS^{-1}$ donde $D$ es diagonal y $S$ es invertible. Lo que esta descomposición "ordena" hacer a los vectores base es transformar su base actual a la base en las columnas de $S$ (esto se hace multiplicando por $S^{-1}$ sobre su base original). La matriz $A$ en esta nueva base parece diagonal, por lo que se multiplica por $D$ . Por último, desea transformar de nuevo a la base original de su problema por lo que se multiplica por $S$ .

En el caso particular de las matrices simétricas, tenemos una garantía sobre la diagonalizabilidad por el teorema espectral:

Teorema espectral : Si $A$ es simétrica, entonces existe una matriz ortogonal $P$ y una matriz diagonal $D$ w donde $A = PDP^T$ . En particular, las entradas diagonales de $D$ son los valores propios de $A$ y las columnas de $P$ a correspondientes vectores propios ortonormales.

Si queremos visualizar esto geométricamente, pensamos en $A$ como teniendo una base especial donde parece diagonal, por lo tanto en esa base todo lo que la matriz hace es estirar, encoger, y posiblemente voltear cada dirección de la base. La matriz $P$ entonces sólo codifica cómo transformar a esta base (vía $P^T$ ) y, a continuación, transformar de nuevo (mediante $P$ ).

Si consideramos el producto interior $x^TAy$ para vectores $x,y$ en nuestro espacio vectorial, podemos descomponer $A$ como

$$ x^TAy \;\; =\;\; x^TPDP^Ty \;\; =\;\; \left (P^Tx\right )^TD \left (P^Ty\right ) \;\; =\;\; \widetilde{x}^TD\widetilde{y}. $$

Por lo tanto, en virtud del cambio de base con $P^T$ vemos que los vectores $\widetilde{x}$ y $\widetilde{y}$ sólo tienen sus componentes multiplicados y luego escalados a través de los componentes de $D$ . Por lo tanto, con este cambio de base, no debería importar realmente cuál multipliques primero. Debería ser lo mismo que escribir $\widetilde{y}^TD\widetilde{x}$ y esto equivale a $y^TAx$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X