Sea $\mathcal{X} = \{\mathbf{X}\in\mathbb{C}^{d\times d}:\|\mathbf{X}\|\leq 1\}$ donde $\|\cdot\|$ es la norma de Frobenius. Sea $\mathbf{y}\in\mathbb{C}^{d\times 1}$ . Estamos familiarizados con la siguiente maximización: \begin{align} \max_{\mathbf{X}\in\mathcal{X}}\|\mathbf{X}\mathbf{y}\| \end{align} Tenemos $\|\mathbf{X}\mathbf{y}\|\leq\|\mathbf{X}\|\|\mathbf{y}\| \leq \|\mathbf{y}\|$ con igualdad si, por ejemplo $\mathbf{X} = \frac{\mathbf{y}\mathbf{y}^{\dagger}}{\|\mathbf{y}\|^2}$ . Por lo tanto, decimos que hay un rango- $1$ solución óptima. Esto es Cauchy-Scharwz disfrazado y el resultado es bastante intuitivo. La forma en que yo lo veo es tomando la descomposición espectral $\mathbf{X}^{\dagger}\mathbf{X} = \sum_i \lambda_i \mathbf{v}_i\mathbf{v}_i^{\dagger}$ . Entonces, $\|\mathbf{X}\mathbf{y}\|^2 = \sum_i \lambda_i |\langle \mathbf{y},\mathbf{v}_i\rangle|^2$ . Tengo un conjunto ortonormal de vectores propios que puedo optimizar, con sus respectivas "potencias" (valores propios) que deben sumar como máximo $1$ . Lo mejor es elegir uno de los $\mathbf{v}_i$ "en dirección a" $\mathbf{y}$ con la potencia máxima de $1$ .
Mi pregunta se refiere a la siguiente generalización. Sea $\mathbf{y}_1,\ldots,\mathbf{y}_K\in\mathbb{C}^{d\times 1}$ y considerar \begin{align} \max_{\mathbf{X}\in\mathcal{X}}\min_{k\in\{1,\ldots,K\}}\|\mathbf{X}\mathbf{y}_k\| \end{align} El problema de optimización analizado anteriormente es un caso particular en el que $K=1$ . Ahora, para cualquier $K>1$ "Intuitivamente", dado que ahora tenemos muchos vectores en muchas direcciones, siempre deberíamos gastar energía en varias direcciones diferentes. Curiosamente, cuando $K\in\{2,3\}$ existe -de nuevo- un rango- $1$ solución óptima (véase, por ejemplo http://www1.se.cuhk.edu.hk/~zhang/Informes/seem2005-02.pdf ). En general, existe un rango aproximado- $\sqrt{K}$ solución óptima, pero el valor exacto parece estar abierto.
Como en el caso de $K=1$ me esforcé mucho para tener una intuición geométrica de por qué el rango $1$ soluciones serían óptimas para $K=2$ o $K=3$ y por qué la escala sería como máximo $\sqrt{K}$ para grandes $K$ pero no he encontrado una explicación razonable. Me preguntaba si alguien tiene alguna idea en este contexto.