Una isometría lineal entre subespacios que no está muy lejos de proyección ortogonal

Question

Una isometría lineal entre subespacios que no está muy lejos de proyección ortogonal

Preguntado el 10 de Mayo, 2018: Cuando se hizo la pregunta
185 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Deje $\mathcal M$ $\mathcal N$ dos subespacios lineales de $\mathbb{R}^n$ tal que $\dim \mathcal M = \dim \mathcal{N}$. Tales subespacios son conocidos por ser isométrica: es decir, existe un bijective lineal operador $T:\mathcal M\to\mathcal N$ tal que $\|Tx\|=\|x\|$ todos los $x\in\mathcal M$. Pero yo quiero elegir a$T$, por lo que no está demasiado lejos de la proyección ortogonal en $\mathcal N$, denotado $P_{\mathcal{N}}$. Existe una isometría $T:\mathcal M\to\mathcal N$ tal que $$ \|Tx-P_\mathcal Nx\|\le \|x-P_\mathcal Nx\|\quad \forall x\in\mathcal M \etiqueta{?} $$

Progreso hasta la fecha

Si $\mathcal M \perp \mathcal N$, la respuesta es trivialmente sí: cualquier isometría funciona porque $P_\mathcal Nx=0$ todos los $x\in \mathcal M$.
Si $\dim \mathcal M = 1 =\dim \mathcal N$, la respuesta también es sí. De hecho, podemos organizar para $\mathcal N$ a ser el eje horizontal en $\mathbb{R}^2$, y para $\mathcal N$ a ser la línea de $\{(t\cos \theta, t\sin\theta) : t\in\mathbb{R}\}$ donde $\theta\in [0, \pi/2]$ es fijo. La isometría $(t \cos\theta, t\sin\theta)\mapsto (t, 0)$ cumple (?) porque $1-\cos \theta \le \sin\theta $.
Basta considerar el caso de $\mathcal M\cap \mathcal N = \{0\}$. De lo contrario, deje $\widetilde{\mathcal M}$ ser el complemento ortogonal de $\mathcal M\cap \mathcal N$$\mathcal M$, y del mismo modo para $\widetilde{\mathcal N}$. Elegir una isometría $\widetilde{T} : \widetilde{\mathcal M} \to \widetilde{\mathcal N}$ por que (?) se mantiene, y se extienden a $T:\mathcal M\to\mathcal N$ dejando $Tx=x$$\mathcal M\cap \mathcal N$. A continuación, $T$ es equivariant con respecto a los cambios a lo largo de $\mathcal M\cap \mathcal N$, y así es $P_{\mathcal N}$, por lo que la propiedad (?) tiene por $T$.

Preguntado el 10 de Mayo, 2018 por zaq

Answer 1

1 Respuestas

Answer 2

4voto

hypernova Puntos 171

Notaciones

En este post, todos los vectores se colocan en la columna de la forma, vectorización y se utiliza ampliamente. En el caso de la presente convención, en esta sección se explica brevemente cómo las notaciones son adoptados.

Deje $\left\{\mathbf{u}_j\right\}_{j=1}^k\subseteq\mathbb{R}^n$ ser un ortonormales base para $\mathcal{M}$. Denotar $U=\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\in\mathbb{R}^{n\times k}$.
Deje $\left\{\mathbf{v}_j\right\}_{j=1}^k\subseteq\mathbb{R}^n$ ser un ortonormales base para $\mathcal{N}$. Denotar $V=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\in\mathbb{R}^{n\times k}$.
Deje $T$ ser una isometría entre el$\mathcal{M}$$\mathcal{N}$. No existe una única $Q\in O(k)$, de tal manera que $$ \left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=VQ. $$ Esto es debido a que cada una de las $T(\mathbf{u}_j)\in\mathcal{N}$, por lo que ofrece una única combinación lineal de $\mathbf{v}_j$'s, es decir, $$ T(\mathbf{u}_j)=\sum_{m=1}^kq_{mj}\mathbf{v}_m=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\left( \begin{array}{c} q_{1j}\\ q_{2j}\\ \vdots\\ q_{kj} \end{array} \right). $$ Así ponen todas las $T(\mathbf{u}_j)$'s juntos, la fórmula de lee $$ \left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\left( \begin{array}{cccc} q_{11}&q_{12}&\cdots&q_{1k}\\ q_{21}&q_{22}&\cdots&q_{2k}\\ \vdots&\vdots&\ddots&\vdots\\ q_{k1}&q_{k2}&\cdots&q_{kk} \end{array} \right)=VQ, $$ donde $Q=\left(q_{jm}\right)_{j,m=1}^k$. Esto demuestra la existencia y la unicidad de $Q$. Además, tenga en cuenta que $T$ es isométrica, para que $T(\mathbf{u}_j)\cdot T(\mathbf{u}_m)=\delta_{jm}$. En la forma de la matriz, este lee $$ I_k=\left( \begin{array}{c} T(\mathbf{u}_1)^{\top}\\ T(\mathbf{u}_2)^{\top}\\ \vdots\\ T(\mathbf{u}_k)^{\top}\\ \end{array} \right)\left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=\left(VQ\right)^{\top}\left(VQ\right)=Q^{\top}V^{\top}VQ=Q^{\top}Q. $$ Aquí $V^{\top}V=I_k$ porque $\mathbf{v}_j$'s son ortonormales. Por lo tanto, $Q\in O(k)$ donde $O(k)$ denota el grupo ortogonal de orden $k$.
Deje $P$ ser la proyección ortogonal de a$\mathcal{M}$$\mathcal{N}$. A continuación, $S=V^{\top}U\in\mathbb{R}^{k\times k}$ es tal que $$ \left(P(\mathbf{u}_1),P(\mathbf{u}_2),\cdots,P(\mathbf{u}_k)\right)=VS. $$ La existencia y la unicidad de $S$ sigue exactamente de los de $T$. Además, puesto que la $P$ es una proyección ortogonal, cada una de las $\mathbf{u}_j-P(\mathbf{u}_j)$ es perpendicular a $\mathcal{N}$, es decir, ortogonal a todos los $\mathbf{v}_j$'s. La forma de la matriz de esta propiedad es que $$ O=\left( \begin{array}{c} \mathbf{v}_1^{\top}\\ \mathbf{v}_2^{\top}\\ \vdots\\ \mathbf{v}_k^{\top} \end{array} \right)\left(\mathbf{u}_1-P(\mathbf{u}_1),\mathbf{u}_2-P(\mathbf{u}_2),\cdots,\mathbf{u}_k-P(\mathbf{u}_k)\right)=V^{\top}\left(U-VS\right)=V^{\top}U-S. $$ Por lo tanto, $S=V^{\top}U$.

Equivalente Problema

Tenga en cuenta que $\forall\mathbf{x}\in\mathcal{M}$, se obtiene una representación única $$ \mathbf{x}=\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\left[\mathbf{x}\right]_{\mathcal{M}}=U\left[\mathbf{x}\right]_{\mathcal{M}}, $$ donde $\left[\mathbf{x}\right]_{\mathcal{M}}$ es el vector coordenado de $\mathbf{x}$ menor a la asignada ortonormales base para $\mathcal{M}$. Además, $\mathbf{x}\in\mathcal{M}$ $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$ son de una correspondencia uno a uno. Su imagen en $T$ lee $$ T(\mathbf{x})=T(\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\left[\mathbf{x}\right]_{\mathcal{M}})=\left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)\left[\mathbf{x}\right]_{\mathcal{M}}=VQ\left[\mathbf{x}\right]_{\mathcal{M}}. $$ Del mismo modo, su imagen en $P$ lee $$ P(\mathbf{x})=VS\left[\mathbf{x}\right]_{\mathcal{M}}. $$

También vale la pena mencionar que una isometría $T$ y su respectiva representación ortogonal $Q$ son de una correspondencia uno a uno así. Dada una isometría $T$, se observa una única matriz ortogonal $O$. Por el contrario, a condición de una matriz ortogonal $O$, se define una isometría $T$.

Con lo anterior vectorizados notaciones y comprensiones, a la pregunta original, para encontrar una isometría $T:\mathcal{M}\to\mathcal{N}$ tal que $$ \left\|T(\mathbf{x})-P(\mathbf{x})\right\|\le\left\|\mathbf{x}-P(\mathbf{x})\right\| $$ tiene para todos los $\mathbf{x}\in\mathcal{M}$, los testigos el siguiente problema equivalente.

Encontrar $Q\in O(k)$ tal que $$ \left\|VQ\left[\mathbf{x}\right]_{\mathcal{M}}-VS\left[\mathbf{x}\right]_{\mathcal{M}}\right\|\le\left\|U\left[\mathbf{x}\right]_{\mathcal{M}}-VS\left[\mathbf{x}\right]_{\mathcal{M}}\right\| $$ tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o lo que es equivalente, de tal manera que $$ \left\|V\left(Q-S\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2\le\left\|\left(U-VS\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2 $$ tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o, equivalentemente, (abierto todos los paréntesis y reorganizar los términos), de tal manera que $$ \left\|\left(Q-2S\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2\le\left\|\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2 $$ tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o lo que es equivalente, de tal manera que $$ \left\|P-2\right\|_2\le 1. $$

Con esto en mente, es suficiente para comprobar si la siguiente proposición es verdadera:

$$ \min\left\{\left\|P-2\right\|_2:Q\in S(k)\right\}\le 1. $$

Aquí el uso de la $\min$ en lugar de $\inf$ es debido a la compacidad de $O(k)$, lo que asegura la existencia del mínimo.

Más allá de la Procrustes

Si la matriz $2$norma $\left\|\cdot\right\|_2$ es reemplazada por la norma de Frobenius $\left\|\cdot\right\|_{F}$, el equivalente problema se reduce a la conocida ortogonal de Procrustes problema, cuya solución ha sido bien estudiado. El operador de la norma de casos como el de la matriz $2$-norma, clásica resultados se podrían encontrar en Watson (1994) y Higham (1989).

Sin embargo, las conclusiones de estas referencias puede ser menos útil para el equivalente problema, porque se trata de general $S$, independientemente del hecho de aquí que $S=V^{\top}U$. Este hecho asegura la siguiente argumento. (Ojalá, no hay necesidad de averiguar el mínimo; en su lugar, un adecuado $Q$ que hace $\left\|Q-2S\right\|_2\le 1$ sería suficiente.)

Tenga en cuenta que $S=V^{\top}U$ $k$a$k$ matriz. Se produce una descomposición de valor singular, es decir, $$ V^{\top}U=S=A\Sigma B^{\superior}, $$ donde $A,B\in O(k)$, e $\Sigma$ es diagonal. Gracias a esta descomposición, $$ \left\|P-2\right\|_2=\left\|AA^{\top}QBB^{\top}-2A\Sigma B^{\top}\right\|_2=\left\|A\left(A^{\top}QB-2\Sigma\right)B^{\top}\right\|_2=\left\|A^{\top}QB-2\Sigma\right\|_2, $$ donde el último paso es debido a la ortogonal de la invariancia de la matriz $2$-norma. Siempre que $A,B,Q\in O(k)$$A^{\top}QB\in O(k)$. Por lo tanto es suficiente con considerar $$ \left\|\tilde{Q}-2\Sigma\right\|_2\le 1 $$ para algunos $\tilde{Q}\in O(k)$. Específicamente, si todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$ (es decir, todos los valores singulares de a $S$ no son más grandes que $1$), $\tilde{Q}=I_k$ sería suficiente para garantizar $$ \left\|\tilde{Q}-2\Sigma\right\|_2\le 1. $$ Por lo tanto el objetivo se reduce a mostrar que todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$.

Deje $\sigma$ ser un valor singular de a $V^{\top}U$. Desde $$ U^{\top}VV^{\top}U=\left(V^{\top}U\right)^{\top}\left(V^{\top}U\right)=B\Sigma^2B^{\superior}, $$ está claro que $\sigma^2$ sirve como un autovalor de a $U^{\top}VV^{\top}U$. En consecuencia, no existe $\mathbf{w}\ne\mathbf{0}$ tal que $$ U^{\top}VV^{\top}U\mathbf{w}=\sigma^2\mathbf{w}. $$ Sin pérdida de generalidad, vamos a $\left\|\mathbf{w}\right\|=1$. Entonces $$ \sigma^2=\sigma^2\mathbf{w}^{\top}\mathbf{w}=\mathbf{w}^{\top}U^{\top}VV^{\top}U\mathbf{w}=\left(V^{\top}U\mathbf{w}\right)^{\top}\left(V^{\top}U\mathbf{w}\right)=\left\|V^{\top}U\mathbf{w}\right\|^2, $$ o, equivalentemente, $$ \sigma=\left\|V^{\top}U\mathbf{w}\right\|\le\left\|V^{\top}\right\|_2\left\|U\mathbf{w}\right\|\le\left\|V^{\top}\right\|_2\left\|U\right\|_2\left\|\mathbf{w}\right\|=\left\|V^{\top}\right\|_2\left\|U\right\|_2. $$ Tenga en cuenta que $U^{\top}U=I_k$, por lo que $\left\|U\right\|_2=1$. Del mismo modo, $V^{\top}V=I_k$. Mientras que esto no conduce a $\left\|V^{\top}\right\|_2=1$ directamente, lo que implica que todos los valores singulares de a$V$$\pm 1$. Por lo tanto todos los valores singulares de a $V^{\top}$ también $\pm 1$$\left\|V^{\top}\right\|_2=1$. Por lo tanto, la última desigualdad de los rendimientos $$ \sigma\le\left\|V^{\top}\right\|_2\left\|U\right\|_2=1. $$ Desde $\sigma$ es un elegido de forma arbitraria valor singular de a $V^{\top}U$, se deduce de inmediato que todos los valores singulares de a $V^{\top}U$ no mayores de $1$, como se espera.

Me gustaría agradecer a OP (@user4412195) para comentar en una alternativa de la prueba, lo que es mucho más sucinta, el hecho de que todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$. Me gustaría recomendar este método aquí. Ya que esto es para mostrar que todos los valores propios de a $S$ no mayores de $1$, es equivalente a demostrar que $\left\|S\right\|_2\le 1$. Gracias a las propiedades de la matriz de la norma, $$ \left\|S\right\|_2=\left\|V^{\top}U\right\|_2\le\left\|V^{\top}\right\|_2\left\|U\right\|_2=\left\|V\right\|_2=1. $$ La conclusión se deduce de inmediato.

En resumen, se ha demostrado que existe cierta $Q\in O(k)$ tal que $$ \left\|P-2\right\|_2\le 1, $$ donde $Q$ podría ser obtenida de la siguiente manera. Deje $V^{\top}U=S=A\Sigma B^{\top}$ ser un singular descomposición, con $A,B\in O(k)$ $\Sigma$ ser una matriz diagonal. Como por el argumento anterior, $$ \left\|I_k-2\Sigma\right\|_2\le 1. $$ Como tal, $Q=AB^{\top}$ sería ortogonal de la matriz que satisface la necesidad.

Acuse de recibo

Me gustaría que la OP (@user4412195) para señalar que el $\tilde{Q}=I_k$ es suficiente para garantizar la $\left\|\tilde{Q}-2\Sigma\right\|_2\le 1$, en lugar de la original de mi "ser una matriz diagonal con las entradas de su diagonal ser $\pm 1$". Agradezco mucho OP comentario en el acortamiento de la prueba de $\left\|S\right\|_2\le 1$.

Respondido el 14 de Mayo, 2018 por hypernova (171 Puntos )

Una isometría lineal entre subespacios que no está muy lejos de proyección ortogonal

Progreso hasta la fecha

Respuesta

Notaciones

Equivalente Problema

Más allá de la Procrustes

Acuse de recibo

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Una isometría lineal entre subespacios que no está muy lejos de proyección ortogonal

Progreso hasta la fecha

Respuesta

Notaciones

Equivalente Problema

Más allá de la Procrustes

Acuse de recibo

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: