Notaciones
En este post, todos los vectores se colocan en la columna de la forma, vectorización y se utiliza ampliamente. En el caso de la presente convención, en esta sección se explica brevemente cómo las notaciones son adoptados.
- Deje $\left\{\mathbf{u}_j\right\}_{j=1}^k\subseteq\mathbb{R}^n$ ser un ortonormales base para $\mathcal{M}$. Denotar $U=\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\in\mathbb{R}^{n\times k}$.
- Deje $\left\{\mathbf{v}_j\right\}_{j=1}^k\subseteq\mathbb{R}^n$ ser un ortonormales base para $\mathcal{N}$. Denotar $V=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\in\mathbb{R}^{n\times k}$.
- Deje $T$ ser una isometría entre el$\mathcal{M}$$\mathcal{N}$. No existe una única $Q\in O(k)$, de tal manera que
$$
\left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=VQ.
$$
Esto es debido a que cada una de las $T(\mathbf{u}_j)\in\mathcal{N}$, por lo que ofrece una única combinación lineal de $\mathbf{v}_j$'s, es decir,
$$
T(\mathbf{u}_j)=\sum_{m=1}^kq_{mj}\mathbf{v}_m=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\left(
\begin{array}{c}
q_{1j}\\
q_{2j}\\
\vdots\\
q_{kj}
\end{array}
\right).
$$
Así ponen todas las $T(\mathbf{u}_j)$'s juntos, la fórmula de lee
$$
\left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=\left(\mathbf{v}_1,\mathbf{v}_2,\cdots,\mathbf{v}_k\right)\left(
\begin{array}{cccc}
q_{11}&q_{12}&\cdots&q_{1k}\\
q_{21}&q_{22}&\cdots&q_{2k}\\
\vdots&\vdots&\ddots&\vdots\\
q_{k1}&q_{k2}&\cdots&q_{kk}
\end{array}
\right)=VQ,
$$
donde $Q=\left(q_{jm}\right)_{j,m=1}^k$. Esto demuestra la existencia y la unicidad de $Q$. Además, tenga en cuenta que $T$ es isométrica, para que $T(\mathbf{u}_j)\cdot T(\mathbf{u}_m)=\delta_{jm}$. En la forma de la matriz, este lee
$$
I_k=\left(
\begin{array}{c}
T(\mathbf{u}_1)^{\top}\\
T(\mathbf{u}_2)^{\top}\\
\vdots\\
T(\mathbf{u}_k)^{\top}\\
\end{array}
\right)\left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)=\left(VQ\right)^{\top}\left(VQ\right)=Q^{\top}V^{\top}VQ=Q^{\top}Q.
$$
Aquí $V^{\top}V=I_k$ porque $\mathbf{v}_j$'s son ortonormales. Por lo tanto, $Q\in O(k)$ donde $O(k)$ denota el grupo ortogonal de orden $k$.
- Deje $P$ ser la proyección ortogonal de a$\mathcal{M}$$\mathcal{N}$. A continuación, $S=V^{\top}U\in\mathbb{R}^{k\times k}$ es tal que
$$
\left(P(\mathbf{u}_1),P(\mathbf{u}_2),\cdots,P(\mathbf{u}_k)\right)=VS.
$$
La existencia y la unicidad de $S$ sigue exactamente de los de $T$. Además, puesto que la $P$ es una proyección ortogonal, cada una de las $\mathbf{u}_j-P(\mathbf{u}_j)$ es perpendicular a $\mathcal{N}$, es decir, ortogonal a todos los $\mathbf{v}_j$'s. La forma de la matriz de esta propiedad es que
$$
O=\left(
\begin{array}{c}
\mathbf{v}_1^{\top}\\
\mathbf{v}_2^{\top}\\
\vdots\\
\mathbf{v}_k^{\top}
\end{array}
\right)\left(\mathbf{u}_1-P(\mathbf{u}_1),\mathbf{u}_2-P(\mathbf{u}_2),\cdots,\mathbf{u}_k-P(\mathbf{u}_k)\right)=V^{\top}\left(U-VS\right)=V^{\top}U-S.
$$
Por lo tanto, $S=V^{\top}U$.
Equivalente Problema
Tenga en cuenta que $\forall\mathbf{x}\in\mathcal{M}$, se obtiene una representación única
$$
\mathbf{x}=\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\left[\mathbf{x}\right]_{\mathcal{M}}=U\left[\mathbf{x}\right]_{\mathcal{M}},
$$
donde $\left[\mathbf{x}\right]_{\mathcal{M}}$ es el vector coordenado de $\mathbf{x}$ menor a la asignada ortonormales base para $\mathcal{M}$. Además, $\mathbf{x}\in\mathcal{M}$ $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$ son de una correspondencia uno a uno. Su imagen en $T$ lee
$$
T(\mathbf{x})=T(\left(\mathbf{u}_1,\mathbf{u}_2,\cdots,\mathbf{u}_k\right)\left[\mathbf{x}\right]_{\mathcal{M}})=\left(T(\mathbf{u}_1),T(\mathbf{u}_2),\cdots,T(\mathbf{u}_k)\right)\left[\mathbf{x}\right]_{\mathcal{M}}=VQ\left[\mathbf{x}\right]_{\mathcal{M}}.
$$
Del mismo modo, su imagen en $P$ lee
$$
P(\mathbf{x})=VS\left[\mathbf{x}\right]_{\mathcal{M}}.
$$
También vale la pena mencionar que una isometría $T$ y su respectiva representación ortogonal $Q$ son de una correspondencia uno a uno así. Dada una isometría $T$, se observa una única matriz ortogonal $O$. Por el contrario, a condición de una matriz ortogonal $O$, se define una isometría $T$.
Con lo anterior vectorizados notaciones y comprensiones, a la pregunta original, para encontrar una isometría $T:\mathcal{M}\to\mathcal{N}$ tal que
$$
\left\|T(\mathbf{x})-P(\mathbf{x})\right\|\le\left\|\mathbf{x}-P(\mathbf{x})\right\|
$$
tiene para todos los $\mathbf{x}\in\mathcal{M}$, los testigos el siguiente problema equivalente.
Encontrar $Q\in O(k)$ tal que
$$
\left\|VQ\left[\mathbf{x}\right]_{\mathcal{M}}-VS\left[\mathbf{x}\right]_{\mathcal{M}}\right\|\le\left\|U\left[\mathbf{x}\right]_{\mathcal{M}}-VS\left[\mathbf{x}\right]_{\mathcal{M}}\right\|
$$
tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o lo que es equivalente, de tal manera que
$$
\left\|V\left(Q-S\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2\le\left\|\left(U-VS\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2
$$
tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o, equivalentemente, (abierto todos los paréntesis y reorganizar los términos), de tal manera que
$$
\left\|\left(Q-2S\right)\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2\le\left\|\left[\mathbf{x}\right]_{\mathcal{M}}\right\|^2
$$
tiene para todos los $\left[\mathbf{x}\right]_{\mathcal{M}}\in\mathbb{R}^k$, o lo que es equivalente, de tal manera que
$$
\left\|P-2\right\|_2\le 1.
$$
Con esto en mente, es suficiente para comprobar si la siguiente proposición es verdadera:
$$
\min\left\{\left\|P-2\right\|_2:Q\in S(k)\right\}\le 1.
$$
Aquí el uso de la $\min$ en lugar de $\inf$ es debido a la compacidad de $O(k)$, lo que asegura la existencia del mínimo.
Más allá de la Procrustes
Si la matriz $2$norma $\left\|\cdot\right\|_2$ es reemplazada por la norma de Frobenius $\left\|\cdot\right\|_{F}$, el equivalente problema se reduce a la conocida ortogonal de Procrustes problema, cuya solución ha sido bien estudiado. El operador de la norma de casos como el de la matriz $2$-norma, clásica resultados se podrían encontrar en Watson (1994) y Higham (1989).
Sin embargo, las conclusiones de estas referencias puede ser menos útil para el equivalente problema, porque se trata de general $S$, independientemente del hecho de aquí que $S=V^{\top}U$. Este hecho asegura la siguiente argumento. (Ojalá, no hay necesidad de averiguar el mínimo; en su lugar, un adecuado $Q$ que hace $\left\|Q-2S\right\|_2\le 1$ sería suficiente.)
Tenga en cuenta que $S=V^{\top}U$ $k$a$k$ matriz. Se produce una descomposición de valor singular, es decir,
$$
V^{\top}U=S=A\Sigma B^{\superior},
$$
donde $A,B\in O(k)$, e $\Sigma$ es diagonal. Gracias a esta descomposición,
$$
\left\|P-2\right\|_2=\left\|AA^{\top}QBB^{\top}-2A\Sigma B^{\top}\right\|_2=\left\|A\left(A^{\top}QB-2\Sigma\right)B^{\top}\right\|_2=\left\|A^{\top}QB-2\Sigma\right\|_2,
$$
donde el último paso es debido a la ortogonal de la invariancia de la matriz $2$-norma. Siempre que $A,B,Q\in O(k)$$A^{\top}QB\in O(k)$. Por lo tanto es suficiente con considerar
$$
\left\|\tilde{Q}-2\Sigma\right\|_2\le 1
$$
para algunos $\tilde{Q}\in O(k)$. Específicamente, si todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$ (es decir, todos los valores singulares de a $S$ no son más grandes que $1$), $\tilde{Q}=I_k$ sería suficiente para garantizar
$$
\left\|\tilde{Q}-2\Sigma\right\|_2\le 1.
$$
Por lo tanto el objetivo se reduce a mostrar que todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$.
Deje $\sigma$ ser un valor singular de a $V^{\top}U$. Desde
$$
U^{\top}VV^{\top}U=\left(V^{\top}U\right)^{\top}\left(V^{\top}U\right)=B\Sigma^2B^{\superior},
$$
está claro que $\sigma^2$ sirve como un autovalor de a $U^{\top}VV^{\top}U$. En consecuencia, no existe $\mathbf{w}\ne\mathbf{0}$ tal que
$$
U^{\top}VV^{\top}U\mathbf{w}=\sigma^2\mathbf{w}.
$$
Sin pérdida de generalidad, vamos a $\left\|\mathbf{w}\right\|=1$. Entonces
$$
\sigma^2=\sigma^2\mathbf{w}^{\top}\mathbf{w}=\mathbf{w}^{\top}U^{\top}VV^{\top}U\mathbf{w}=\left(V^{\top}U\mathbf{w}\right)^{\top}\left(V^{\top}U\mathbf{w}\right)=\left\|V^{\top}U\mathbf{w}\right\|^2,
$$
o, equivalentemente,
$$
\sigma=\left\|V^{\top}U\mathbf{w}\right\|\le\left\|V^{\top}\right\|_2\left\|U\mathbf{w}\right\|\le\left\|V^{\top}\right\|_2\left\|U\right\|_2\left\|\mathbf{w}\right\|=\left\|V^{\top}\right\|_2\left\|U\right\|_2.
$$
Tenga en cuenta que $U^{\top}U=I_k$, por lo que $\left\|U\right\|_2=1$. Del mismo modo, $V^{\top}V=I_k$. Mientras que esto no conduce a $\left\|V^{\top}\right\|_2=1$ directamente, lo que implica que todos los valores singulares de a$V$$\pm 1$. Por lo tanto todos los valores singulares de a $V^{\top}$ también $\pm 1$$\left\|V^{\top}\right\|_2=1$. Por lo tanto, la última desigualdad de los rendimientos
$$
\sigma\le\left\|V^{\top}\right\|_2\left\|U\right\|_2=1.
$$
Desde $\sigma$ es un elegido de forma arbitraria valor singular de a $V^{\top}U$, se deduce de inmediato que todos los valores singulares de a $V^{\top}U$ no mayores de $1$, como se espera.
Me gustaría agradecer a OP (@user4412195) para comentar en una alternativa de la prueba, lo que es mucho más sucinta, el hecho de que todas las entradas de la diagonal de a $\Sigma$ no mayores de $1$. Me gustaría recomendar este método aquí. Ya que esto es para mostrar que todos los valores propios de a $S$ no mayores de $1$, es equivalente a demostrar que $\left\|S\right\|_2\le 1$. Gracias a las propiedades de la matriz de la norma,
$$
\left\|S\right\|_2=\left\|V^{\top}U\right\|_2\le\left\|V^{\top}\right\|_2\left\|U\right\|_2=\left\|V\right\|_2=1.
$$
La conclusión se deduce de inmediato.
En resumen, se ha demostrado que existe cierta $Q\in O(k)$ tal que
$$
\left\|P-2\right\|_2\le 1,
$$
donde $Q$ podría ser obtenida de la siguiente manera. Deje $V^{\top}U=S=A\Sigma B^{\top}$ ser un singular descomposición, con $A,B\in O(k)$ $\Sigma$ ser una matriz diagonal. Como por el argumento anterior,
$$
\left\|I_k-2\Sigma\right\|_2\le 1.
$$
Como tal, $Q=AB^{\top}$ sería ortogonal de la matriz que satisface la necesidad.
Acuse de recibo
Me gustaría que la OP (@user4412195) para señalar que el $\tilde{Q}=I_k$ es suficiente para garantizar la $\left\|\tilde{Q}-2\Sigma\right\|_2\le 1$, en lugar de la original de mi "ser una matriz diagonal con las entradas de su diagonal ser $\pm 1$". Agradezco mucho OP comentario en el acortamiento de la prueba de $\left\|S\right\|_2\le 1$.