Si $A^TA = I$ donde $A$ es una matriz triangular inferior, ¿significa eso que $A$ tiene que ser una matriz identidad (y nada más)? En general, ¿qué tipo de matriz $A$ para que esa igualdad se mantenga?
Respuestas
¿Demasiados anuncios?Matrices que cumplen $AA^T=I$ se denominan ortogonales. La propiedad equivale a que las filas (y columnas) forman una base ortonormal.
Si $A$ es ortogonal y triangular inferior entonces $A$ es diagonal con entradas diagonales cada $1$ o $-1$ . Sea $e_i$ denotan los vectores de base estándar. La primera fila es múltiplo de $e_1$ y tiene norma $1$ por lo que debe ser $e_1$ o $-e_1$ . La segunda fila es una combinación lineal de $e_1$ y $e_2$ pero es ortogonal a $e_1$ y tiene norma $1$ por lo que es sólo $e_2$ o $-e_2$ . Continuando de esta manera se puede ver que el $i$ -ésima fila es sólo $e_i$ o $-e_i$ .
OK, ¡ediciones completas!
Dejando de lado por el momento la triangularidad inferior, tomemos cualquier $m$ vectores mutuamente ortonormales $\vec n_1, \vec n_2, \ldots, \vec n_m \in \Bbb R^m$ para que $\langle \vec n_j, \vec n_k \rangle = \delta_{jk}$ y convertirlos en una matriz $N$ utilizándolas como columnas, por lo que podemos escribir $N$ en forma de columna como
$N = \begin{bmatrix} \vec n_1 & \vec n_2 & \ldots & \vec n_m \end{bmatrix}; \tag{1}$
entonces las filas de $N^T$ son las columnas de $N$ cada uno transpuesto:
$N^T = \begin{bmatrix} \vec n_1^T \\ \vec n_2^T \\ \vdots \\ \vec n_m^T \end{bmatrix}. \tag{2}$
Así
$N^TN = \begin{bmatrix} \vec n_1^T \\ \vec n_2^T \\ \vdots \\ \vec n_m^T \end{bmatrix} \begin{bmatrix} \vec n_1 & \vec n_2 & \ldots & \vec n_m \end{bmatrix} = [\langle \vec n_j, \vec n_k \rangle ] = [\delta_{jk}] = I, \tag{3}$
para $1 \le j, k \le m$ . Esto demuestra que hay muchos matrices que cumplan $A^TA = I$ . Además, las columnas de $N$ son linealmente independientes, ya que cualquier sistema de vectores ortonormales es independiente (y lo daré por sabido); por tanto $\det N \ne 0$ y $N$ es invertible. O se puede argumentar a partir de (3) que
$(\det N^T)(\det N) = \det N^TN = 1, \tag{4}$
mostrando $\det N \ne 0$ y la existencia de $N^{-1}$ sigue. Teniendo $N^{-1}$ obtenemos de (3)
$N^T = N^TI = N^T(N N^{-1}) = (N^T N)N^{-1} = IN^{-1} = N^{-1}, \tag{5}$
para que $N^T = N^{-1}$ por lo que (3) da como resultado
$NN^T = NN^{-1} = I \tag{6}$
también. Así que en el caso general vemos que
$\bullet$ $N = I$ no tiene por qué aguantar;
$\bullet$ hay muchas otras posibilidades, una para cada marco ortonormal $\vec n_1, \vec n_2, \ldots, \vec n_m \in \Bbb R^m$ ;
$\bullet$ la propiedad clave es que las filas sean ortonormales, al igual que las columnas; en términos algebraicos, esto se traduce directamente en $N^TN = NN^T = I$ .
Volviendo finalmente al caso $N$ triangular inferior, vemos en este caso $N^T$ es triangular superior. En esta situación, $N$ adopta la forma de una matriz diagonal con entradas diagonales $\pm 1$ para ver esto, podemos escribir la ecuación matricial $N^TN = I$ en función de las componentes de los vectores $\vec n_i = (n_{i1}, n_{i2}, \ldots, n_{im})^T$ ; vemos que el resultado es un sistema de ecuaciones cuadráticas en el $m(m + 1)/2$ incógnitas $n_{ij}$ donde $1 \le j \le i$ por la triangularidad inferior de $N$ ; el resto $n_{ij} = 0$ , $1 \le i < j$ ya que $(N^T)_{jl} = N_{lj} = n_{lj}$ las ecuaciones pueden formularse de la forma
$\sum_{l = 1}^m n_{lj}n_{lk} = \delta_{jk}, \tag{7}$
y puesto que la matriz $N$ es triangular inferior, siempre tenemos $n_{lk} = 0$ para $ l < k$ por lo que (7) se reduce a
$\sum_{l = k}^m n_{lj}n_{lk} = \delta_{jk}. \tag{8}$
El sistema de ecuaciones (8) puede resolverse aparentemente comenzando por $j = k = m$ con lo que (8) se convierte en $n_{mm}^2 = 1$ Así pues $n_{mm} = \pm 1$ y así $n_{mj} = 0$ , $j < m$ ya que tomando $k = m$ , $j < m$ (8) se convierte simplemente en
$n_{mj} = n_{mj}n_{mm} = \delta_{jm} = 0, \tag{9}$
de donde $n_{mj} = 0$ desde $n_{mm} = \pm 1$ . Teniendo la $m$ -ésima fila de $N$ podemos ir descendiendo en $k$ encontrando sucesivamente las filas restantes de $N$ por ejemplo, con $j = k = m - 1$ tenemos
$n_{m - 1 \; m - 1}^2 + n_{m \; m - 1}^2 = \sum_{l = m - 1}^m n_{l \; m - 1} n_{l \; m - 1} = \delta_{m - 1 \; m - 1} = 1; \tag{10}$
ahora usando $n_{m \; m - 1} = 0$ vemos que $n_{m - 1 \; m - 1} = \pm 1$ y procedemos como antes, eventualmente bajando hasta $k = 1$ y acumulando los resultados $n_{kk} = \pm 1$ , $n_{jk} = 0$ en el proceso; $N$ se ve que es una matriz diagonal cuyas únicas entradas no nulas son las $n_{kk} = \pm 1$ , $1 \le k \le m$ .
Existen $2^m$ tales matrices.
Como nota final, me dirijo a la pregunta del OP de la corriente de comentarios: si $L$ y $M$ son triangulares inferiores, con $L$ invertible y $(L^{-1}M)(L^{-1}M)^T = I$ entonces $L^{-1}$ es triangular inferior (véase Demuestre que A es invertible y que es triangular inferior. ) y, por tanto $N = L^{-1}M$ también es triangular inferior; las matrices triangulares inferiores son cerradas bajo multiplicación. Entonces $N = L^{-1}M$ satisface $NN^T = I$ Así que $(\det N)(\det N^T) = 1$ Así que $\det N \ne 0$ y $N$ es invertible, por lo que podemos escribir $N^{-1} = N^T$ y, por tanto $N^TN = I$ también. De lo que hemos visto anteriormente, podemos concluir que $N$ es una matriz diagonal con todas las entradas distintas de cero $\pm 1$ ; sin entrada diagonal $n_{jj} = 0$ . $L^{-1}M = N$ implica $M= LN$ ; $L = M$ sólo si $N = I$ . El efecto de la mutiplicación derecha $L$ por $N$ es invertir el signo de la columna $j$ de $L$ sólo si $n_{jj} = -1$ los vectores columna restantes son invariantes a la izquierda.
Espero que esto ayude. Hasta luego,
y como siempre,
¡¡¡Fiat Lux!!!