6 votos

Una isometría lineal entre subespacios que no está muy lejos de proyección ortogonal

Deje $\mathcal M$ $\mathcal N$ dos subespacios lineales de $\mathbb{R}^n$ tal que $\dim \mathcal M = \dim \mathcal{N}$. Tales subespacios son conocidos por ser isométrica: es decir, existe un bijective lineal operador $T:\mathcal M\to\mathcal N$ tal que $\|Tx\|=\|x\|$ todos los $x\in\mathcal M$. Pero yo quiero elegir a$T$, por lo que no está demasiado lejos de la proyección ortogonal en $\mathcal N$, denotado $P_{\mathcal{N}}$. Existe una isometría $T:\mathcal M\to\mathcal N$ tal que $$ \|Tx-P_\mathcal Nx\|\le \|x-P_\mathcal Nx\|\quad \forall x\in\mathcal M \etiqueta{?} $$


Progreso hasta la fecha

  • Si $\mathcal M \perp \mathcal N$, la respuesta es trivialmente sí: cualquier isometría funciona porque $P_\mathcal Nx=0$ todos los $x\in \mathcal M$.

  • Si $\dim \mathcal M = 1 =\dim \mathcal N$, la respuesta también es sí. De hecho, podemos organizar para $\mathcal N$ a ser el eje horizontal en $\mathbb{R}^2$, y para $\mathcal N$ a ser la línea de $\{(t\cos \theta, t\sin\theta) : t\in\mathbb{R}\}$ donde $\theta\in [0, \pi/2]$ es fijo. La isometría $(t \cos\theta, t\sin\theta)\mapsto (t, 0)$ cumple (?) porque $1-\cos \theta \le \sin\theta $.

  • Basta considerar el caso de $\mathcal M\cap \mathcal N = \{0\}$. De lo contrario, deje $\widetilde{\mathcal M}$ ser el complemento ortogonal de $\mathcal M\cap \mathcal N$$\mathcal M$, y del mismo modo para $\widetilde{\mathcal N}$. Elegir una isometría $\widetilde{T} : \widetilde{\mathcal M} \to \widetilde{\mathcal N}$ por que (?) se mantiene, y se extienden a $T:\mathcal M\to\mathcal N$ dejando $Tx=x$$\mathcal M\cap \mathcal N$. A continuación, $T$ es equivariant con respecto a los cambios a lo largo de $\mathcal M\cap \mathcal N$, y así es $P_{\mathcal N}$, por lo que la propiedad (?) tiene por $T$.

4voto

hypernova Puntos 171

Notaciones

En este post, todos los vectores se colocan en la columna de la forma, vectorización y se utiliza ampliamente. En el caso de la presente convención, en esta sección se explica brevemente cómo las notaciones son adoptados.

  • Deje $\left\{\mathbf{u}_j\right\}_{j=1}^k\subseteq\mathbb{R}^n$ ser un ortonormales base para $\mathcal{M}$. Denotar $U=\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\in\mathbb{R}^{n\times k}$.
  • Deje $\left\{\mathbf{v}_j\right\}_{j=1}^k\subseteq\mathbb{R}^n$ ser un ortonormales base para $\mathcal{N}$. Denotar $V=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\in\mathbb{R}^{n\times k}$.
  • Deje $T$ ser una isometría entre el$\mathcal{M}$$\mathcal{N}$. No existe una única $Q\in O(k)$, de tal manera que $$ \left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=VQ. $$ Esto es debido a que cada una de las $T(\mathbf{u}_j)\in\mathcal{N}$, por lo que ofrece una única combinación lineal de $\mathbf{v}_j$'s, es decir, $$ T(\mathbf{u}_j)=\sum_{m=1}^kq_{mj}\mathbf{v}_m=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\left( \begin{array}{c} q_{1j}\\ q_{2j}\\ \vdots\\ q_{kj} \end{array} \right). $$ Así ponen todas las $T(\mathbf{u}_j)$'s juntos, la fórmula de lee $$ \left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\left( \begin{array}{cccc} q_{11}&q_{12}&\cdots&q_{1k}\\ q_{21}&q_{22}&\cdots&q_{2k}\\ \vdots&\vdots&\ddots&\vdots\\ q_{k1}&q_{k2}&\cdots&q_{kk} \end{array} \right)=VQ, $$ donde $Q=\left(q_{jm}\right)_{j,m=1}^k$. Esto demuestra la existencia y la unicidad de $Q$. Además, tenga en cuenta que $T$ es isométrica, para que $T(\mathbf{u}_j)\cdot T(\mathbf{u}_m)=\delta_{jm}$. En la forma de la matriz, este lee $$ I_k=\left( \begin{array}{c} T(\mathbf{u}_1)^{\top}\\ T(\mathbf{u}_2)^{\top}\\ \vdots\\ T(\mathbf{u}_k)^{\top}\\ \end{array} \right)\left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=\left(VQ\right)^{\top}\left(VQ\right)=Q^{\top}V^{\top}VQ=Q^{\top}Q. $$ Aquí $V^{\top}V=I_k$ porque $\mathbf{v}_j$'s son ortonormales. Por lo tanto, $Q\in O(k)$ donde $O(k)$ denota el grupo ortogonal de orden $k$.
  • Deje $P$ ser la proyección ortogonal de a$\mathcal{M}$$\mathcal{N}$. A continuación, $S=V^{\top}U\in\mathbb{R}^{k\times k}$ es tal que $$ \left(P(\mathbf{u}_1),P(\mathbf{u}_2),\cdots,P(\mathbf{u}_k)\right)=VS. $$ La existencia y la unicidad de $S$ sigue exactamente de los de $T$. Además, puesto que la $P$ es una proyección ortogonal, cada una de las $\mathbf{u}_j-P(\mathbf{u}_j)$ es perpendicular a $\mathcal{N}$, es decir, ortogonal a todos los $\mathbf{v}_j$'s. La forma de la matriz de esta propiedad es que $$ O=\left( \begin{array}{c} \mathbf{v}_1^{\top}\\ \mathbf{v}_2^{\top}\\ \vdots\\ \mathbf{v}_k^{\top} \end{array} \right)\left(\mathbf{u}_1-P(\mathbf{u}_1),\mathbf{u}_2-P(\mathbf{u}_2),\cdots,\mathbf{u}_k-P(\mathbf{u}_k)\right)=V^{\top}\left(U-VS\right)=V^{\top}U-S. $$ Por lo tanto, $S=V^{\top}U$.

Equivalente Problema

Tenga en cuenta que $\forall\mathbf{x}\in\mathcal{M}$, se obtiene una representación única $$ \mathbf{x}=\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\left[\mathbf{x}\right]_{\mathcal{M}}=U\left[\mathbf{x}\right]_{\mathcal{M}}, $$ donde $\left[\mathbf{x}\right]_{\mathcal{M}}$ es el vector coordenado de $\mathbf{x}$ menor a la asignada ortonormales base para $\mathcal{M}$. Además, $\mathbf{x}\in\mathcal{M}$ $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$ son de una correspondencia uno a uno. Su imagen en $T$ lee $$ T(\mathbf{x})=T(\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\left[\mathbf{x}\right]_{\mathcal{M}})=\left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)\left[\mathbf{x}\right]_{\mathcal{M}}=VQ\left[\mathbf{x}\right]_{\mathcal{M}}. $$ Del mismo modo, su imagen en $P$ lee $$ P(\mathbf{x})=VS\left[\mathbf{x}\right]_{\mathcal{M}}. $$

También vale la pena mencionar que una isometría $T$ y su respectiva representación ortogonal $Q$ son de una correspondencia uno a uno así. Dada una isometría $T$, se observa una única matriz ortogonal $O$. Por el contrario, a condición de una matriz ortogonal $O$, se define una isometría $T$.

Con lo anterior vectorizados notaciones y comprensiones, a la pregunta original, para encontrar una isometría $T:\mathcal{M}\to\mathcal{N}$ tal que $$ \left\|T(\mathbf{x})-P(\mathbf{x})\right\|\le\left\|\mathbf{x}-P(\mathbf{x})\right\| $$ tiene para todos los $\mathbf{x}\in\mathcal{M}$, los testigos el siguiente problema equivalente.

Encontrar $Q\in O(k)$ tal que $$ \left\|VQ\left[\mathbf{x}\right]_{\mathcal{M}}-VS\left[\mathbf{x}\right]_{\mathcal{M}}\right\|\le\left\|U\left[\mathbf{x}\right]_{\mathcal{M}}-VS\left[\mathbf{x}\right]_{\mathcal{M}}\right\| $$ tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o lo que es equivalente, de tal manera que $$ \left\|V\left(Q-S\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2\le\left\|\left(U-VS\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2 $$ tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o, equivalentemente, (abierto todos los paréntesis y reorganizar los términos), de tal manera que $$ \left\|\left(Q-2S\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2\le\left\|\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2 $$ tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o lo que es equivalente, de tal manera que $$ \left\|P-2\right\|_2\le 1. $$

Con esto en mente, es suficiente para comprobar si la siguiente proposición es verdadera:

$$ \min\left\{\left\|P-2\right\|_2:Q\in S(k)\right\}\le 1. $$

Aquí el uso de la $\min$ en lugar de $\inf$ es debido a la compacidad de $O(k)$, lo que asegura la existencia del mínimo.

Más allá de la Procrustes

Si la matriz $2$norma $\left\|\cdot\right\|_2$ es reemplazada por la norma de Frobenius $\left\|\cdot\right\|_{F}$, el equivalente problema se reduce a la conocida ortogonal de Procrustes problema, cuya solución ha sido bien estudiado. El operador de la norma de casos como el de la matriz $2$-norma, clásica resultados se podrían encontrar en Watson (1994) y Higham (1989).

Sin embargo, las conclusiones de estas referencias puede ser menos útil para el equivalente problema, porque se trata de general $S$, independientemente del hecho de aquí que $S=V^{\top}U$. Este hecho asegura la siguiente argumento. (Ojalá, no hay necesidad de averiguar el mínimo; en su lugar, un adecuado $Q$ que hace $\left\|Q-2S\right\|_2\le 1$ sería suficiente.)

Tenga en cuenta que $S=V^{\top}U$ $k$a$k$ matriz. Se produce una descomposición de valor singular, es decir, $$ V^{\top}U=S=A\Sigma B^{\superior}, $$ donde $A,B\in O(k)$, e $\Sigma$ es diagonal. Gracias a esta descomposición, $$ \left\|P-2\right\|_2=\left\|AA^{\top}QBB^{\top}-2A\Sigma B^{\top}\right\|_2=\left\|A\left(A^{\top}QB-2\Sigma\right)B^{\top}\right\|_2=\left\|A^{\top}QB-2\Sigma\right\|_2, $$ donde el último paso es debido a la ortogonal de la invariancia de la matriz $2$-norma. Siempre que $A,B,Q\in O(k)$$A^{\top}QB\in O(k)$. Por lo tanto es suficiente con considerar $$ \left\|\tilde{Q}-2\Sigma\right\|_2\le 1 $$ para algunos $\tilde{Q}\in O(k)$. Específicamente, si todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$ (es decir, todos los valores singulares de a $S$ no son más grandes que $1$), $\tilde{Q}=I_k$ sería suficiente para garantizar $$ \left\|\tilde{Q}-2\Sigma\right\|_2\le 1. $$ Por lo tanto el objetivo se reduce a mostrar que todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$.

Deje $\sigma$ ser un valor singular de a $V^{\top}U$. Desde $$ U^{\top}VV^{\top}U=\left(V^{\top}U\right)^{\top}\left(V^{\top}U\right)=B\Sigma^2B^{\superior}, $$ está claro que $\sigma^2$ sirve como un autovalor de a $U^{\top}VV^{\top}U$. En consecuencia, no existe $\mathbf{w}\ne\mathbf{0}$ tal que $$ U^{\top}VV^{\top}U\mathbf{w}=\sigma^2\mathbf{w}. $$ Sin pérdida de generalidad, vamos a $\left\|\mathbf{w}\right\|=1$. Entonces $$ \sigma^2=\sigma^2\mathbf{w}^{\top}\mathbf{w}=\mathbf{w}^{\top}U^{\top}VV^{\top}U\mathbf{w}=\left(V^{\top}U\mathbf{w}\right)^{\top}\left(V^{\top}U\mathbf{w}\right)=\left\|V^{\top}U\mathbf{w}\right\|^2, $$ o, equivalentemente, $$ \sigma=\left\|V^{\top}U\mathbf{w}\right\|\le\left\|V^{\top}\right\|_2\left\|U\mathbf{w}\right\|\le\left\|V^{\top}\right\|_2\left\|U\right\|_2\left\|\mathbf{w}\right\|=\left\|V^{\top}\right\|_2\left\|U\right\|_2. $$ Tenga en cuenta que $U^{\top}U=I_k$, por lo que $\left\|U\right\|_2=1$. Del mismo modo, $V^{\top}V=I_k$. Mientras que esto no conduce a $\left\|V^{\top}\right\|_2=1$ directamente, lo que implica que todos los valores singulares de a$V$$\pm 1$. Por lo tanto todos los valores singulares de a $V^{\top}$ también $\pm 1$$\left\|V^{\top}\right\|_2=1$. Por lo tanto, la última desigualdad de los rendimientos $$ \sigma\le\left\|V^{\top}\right\|_2\left\|U\right\|_2=1. $$ Desde $\sigma$ es un elegido de forma arbitraria valor singular de a $V^{\top}U$, se deduce de inmediato que todos los valores singulares de a $V^{\top}U$ no mayores de $1$, como se espera.

Me gustaría agradecer a OP (@user4412195) para comentar en una alternativa de la prueba, lo que es mucho más sucinta, el hecho de que todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$. Me gustaría recomendar este método aquí. Ya que esto es para mostrar que todos los valores propios de a $S$ no mayores de $1$, es equivalente a demostrar que $\left\|S\right\|_2\le 1$. Gracias a las propiedades de la matriz de la norma, $$ \left\|S\right\|_2=\left\|V^{\top}U\right\|_2\le\left\|V^{\top}\right\|_2\left\|U\right\|_2=\left\|V\right\|_2=1. $$ La conclusión se deduce de inmediato.

En resumen, se ha demostrado que existe cierta $Q\in O(k)$ tal que $$ \left\|P-2\right\|_2\le 1, $$ donde $Q$ podría ser obtenida de la siguiente manera. Deje $V^{\top}U=S=A\Sigma B^{\top}$ ser un singular descomposición, con $A,B\in O(k)$ $\Sigma$ ser una matriz diagonal. Como por el argumento anterior, $$ \left\|I_k-2\Sigma\right\|_2\le 1. $$ Como tal, $Q=AB^{\top}$ sería ortogonal de la matriz que satisface la necesidad.

Acuse de recibo

Me gustaría que la OP (@user4412195) para señalar que el $\tilde{Q}=I_k$ es suficiente para garantizar la $\left\|\tilde{Q}-2\Sigma\right\|_2\le 1$, en lugar de la original de mi "ser una matriz diagonal con las entradas de su diagonal ser $\pm 1$". Agradezco mucho OP comentario en el acortamiento de la prueba de $\left\|S\right\|_2\le 1$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X