¿Todas las matrices de proyección toman la forma $P = A{(A^TA)}^{-1}A^T$ ? Si es así, ¿puedes ayudarme a derivarlo y explicarlo intuitivamente?
Respuestas
¿Demasiados anuncios?$A(A^TA)^{-1}A^T$ es simétrica, pero no todas las matrices de proyección son simétricas --- como $\pmatrix{1&1\\ 0&0}$. Por lo tanto la respuesta es claramente no.
Es cierto, sin embargo, que todos ortogonal (con respecto a la costumbre producto interior) matrices de proyección de más de $\mathbb R$ puede ser escrita en la forma de $A(A^TA)^{-1}A^T$. Por definición, si $P\in M_n(\mathbb R)$ es una proyección ortogonal, entonces $P|_U=\operatorname{id}$ e $P|_{U^\perp}=0$ para algunos subespacio $U\subseteq\mathbb R^n$. Deje $A$ ser cualquier matriz cuyas columnas forman una base de $U$ (base va a hacer; no tiene que ser ortonormales). A continuación, $A^TA$ es nonsingular y $A(A^TA)^{-1}A^Tv=0$ por cada $v\in U^\perp$. También, desde las columnas de $A$ span $U$, todos los vectores $u\in U$ puede ser escrito como $Ax$ para algunos $x\in\mathbb R^n$. Por lo tanto $$ \left(A(A^TA)^{-1}A^T\right)u=\left(A(A^TA)^{-1}A^T\right)(Ax)=\left(A(A^TA)^{-1}A^TA\right)x=Ax=u $$ para cada $u=Ax\in U$. Por lo tanto $P$ e $A(A^TA)^{-1}A^T$ está de acuerdo en todas partes en $\mathbb R^n$, es decir, $P=A(A^TA)^{-1}A^T$.
Como se ha señalado por @user1551, esto sólo es cierto para la proyección ortogonal de matrices.
Deje $P$ ser la proyección ortogonal del operador que los proyectos de un vector $b \in \mathbb R^n$ sobre un subespacio $S \subset \mathbb R^n$. Deje $(a_1,\ldots,a_m)$ ser una base para $S$, y deje $A$ ser la matriz cuyas $i$ésima columna es $a_i$. A continuación, $S =\{Ax \mid x \in \mathbb R^m\}$, y la proyección de $b$ a $S$ es equivalente a la selección de $x$ , de modo de minimizar la distancia de $b$ a $Ax$. Equivalentemente, se desea minimizar $$ r(x) = \| Ax - b \|^2. $$ Este es un problema de mínimos cuadrados. Establecer el gradiente igual a $0$, nos encontramos con que $x$satisface $$ \etiqueta{1} A^T(Ax-b) = 0 $$ o, equivalentemente, $$A^TA x = A^T b.$$ (Este sistema de ecuaciones es a menudo llamado el "normal ecuaciones". Visualmente, la ecuación (1) dice que el vector residual $b - Ax$ es ortogonal a la columna espacio de $A$.)
De ello se desprende que $x = (A^T A)^{-1} A^T b$. Por lo que la proyección de $b$ a $S$es $$ P(x) = Ax = A(A^T)^{-1} A^T b. $$