Recientemente tomé un mejor vistazo al operador de la norma definida en una matriz de $\mathbf A \in \Bbb{K}^{n\times n}$ como sigue:
$$ \|\mathbf Un\|_p=\sup\{\|\mathbf Ax\|_p \mid x\in\Bbb{K}^n\tierra\|x\|=1\} $$
La primera vez que veía esto pensé "ok, vamos a calcular para un par de ejemplo de las matrices". Empecé con $n = 3$$p = 2$, sólo el comienzo "simple". Vamos $$ \mathbf A = \left[\begin{matrix}a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{de la matriz}\right]\quad a_{ij}\in\Bbb{K}^n $$ Ahora si vamos a minimizar $\|\mathbf Ax\|_2$ ($ = \|\mathbf Ax\|$), podríamos hacerlo fácil en nosotros mismos y sólo minimizar $\|\mathbf Ax\|^2$ así que como para no preocuparse de que molesto radical. Tenemos $$ \begin{align} \|\mathbf Ax\|^2 & = (a_{11}x_1 + a_{12}x_2 + a_{13}x_3)^2 + (a_{21}x_1 + a_{22}x_2 + a_{23}x_3)^2 + (a_{31}x_1 + a_{32}x_2 + a_{33}x_3)^2 \\ & = Ax_1^2 + Bx_2^2 + Cx_3^2 + Dx_1x_2 + Ex_1x_3 + Fx_2x_3 \end{align} $$ donde $$ \begin{align} A & = a_{11}^2+a_{21}^2+a_{31}^2 \\ B & = a_{12}^2+a_{22}^2+a_{32}^2 \\ C & = a_{13}^2+a_{23}^2+a_{33}^2 \\ D & = 2(a_{11}a_{12} + a_{21}a_{22} + a_{31}a_{33}) \\ E & = 2(a_{11}a_{13} + a_{21}a_{23} + a_{31}a_{33}) \\ F & = 2(a_{12}a_{13} + a_{22}a_{23} + a_{32}a_{33}) \end{align} $$ Ahora vamos a definir $$ G(x_1,\ x_2,\ x_3) = Ax_1^2+Bx_2^2+Cx_3^2+Dx_1x_2+Ex_1x_3+Fx_2x_3 $$ Así que, si queremos minimizar $||\mathbf Ax||^2$, estamos bien vamos a tener que minimizar $$ N(x_1,\ x_2,\ x_3) = \frac{G(x_1,\ x_2,\ x_3)}{x_1^2+x_2^2+x_3^2} $$ o simplemente minimizar $G$ con la restricción $g(x_1,\ x_2,\ x_3) = x_1^2 + x_2^2 + x_3^2 = 1$. El último parecía más fácil para mí, así que me dio un tiro, el uso de multiplicadores de Lagrange.
Como de costumbre, me define $$ \mathcal{L}(x_1,\ x_2,\ x_3,\ \lambda) = G(x_1,\ x_2,\ x_3)-\lambda g(x_1,\ x_2,\ x_3) $$ la configuración es degradado a cero da $$ \nabla \mathcal L = 0 \implica \begin{cases} 2(A - \lambda)x_1 + Dx_2 + Ex_3 & = 0 \\ Dx_1 + 2(B - \lambda)x_2 + Fx_3 & = 0 \\ Ex_1 + Fx_2 + 2(C - \lambda)x_3 & = 0 \\ x_1^2 + x_2^2 + x_3^2 - 1 & = 0 \end{casos} $$ Ahora esto es donde realmente empecé a atascarse. Traté de resolver las tres primeras ecuaciones para $x_1,\ x_2,$ $x_3$ pero no acabar con cualquier cosa que podría utilizar. He intentado solucionar $x_1$ en términos de$x_2,\ x_3,$$\lambda$, $x_2$ en términos de$x_3$$\lambda$, y, a continuación, subbing que todos en la tercera ecuación, pero terminó con $x_3 = 0$ o $$ 4\lambda^3 - 4\lambda^2(a+B+C) + \lambda(4AB+4AC+4AC-D2+E^2+B^2)-4ABC-AF^2-^2+CD^2+DEF = 0 $$ que, aunque técnicamente es solucionable por $\lambda$ a través de la ecuación cúbica, sería increíblemente desordenado.
Ahora, probablemente creado mi propio obstáculo para este problema, porque no quería pensar sobre el sistema de ecuaciones de manera lógica y sólo quería bash. A pesar de mi enfoque, parece que el operador de la norma es una cosa muy difícil de calcular, y que sólo se analizó el caso en que $n = 3$$p = 2$. ¿Y el caso general? Lo que si $n = 75$$p = 9/4$? Cómo en el mundo podría calcular, entonces?
Las preguntas son retóricas, sin embargo, y mi pregunta es la siguiente:
Por qué definir una norma ordinaria para matrices que es tan difícil de calcular en general?
Veo que el operador de la norma en todas partes, y parece que la norma estándar para una gran cantidad de teoremas (a menos que me equivoco y ||A|| a significa que cualquier norma de la matriz). Entonces, ¿por qué habríamos de definir una norma estándar en una manera que es muy difícil de calcular? ¿Cuál es el punto? Es fácil trabajar en teoremas? Me sale que es intuitivamente tiene sentido como una norma, pero que no puede ser fácil para trabajar, sobre todo en comparación a cosas como la norma de Frobenius.
Entonces, ¿por qué nos preocupamos de esta definición?