40 votos

¿Cuál es la intuición para la norma de rastreo (norma nuclear)?

Voy palabra esta pregunta en términos de la linealidad de los operadores que actúan en $\mathbb{C}^n$ por la simplicidad. Siéntase libre de dar una respuesta en términos mas generales de espacios de Hilbert si usted piensa que tiene más sentido de esa manera.

El estándar de la norma inducida por el producto interior en $\mathbb{C}^n$ es la norma Euclídea $ \sqrt{\langle x, x\rangle} = \| x \|_2 = \sqrt{\sum_i |x_i|^2}$. Del mismo modo, dotado del producto interior $\langle A, B\rangle = \text{trace}(A^* B)$, el espacio de $n \times n$ matrices complejas formas un producto interior en el espacio con la inducida por la norma de Frobenius $ \|A\|_2 = \sqrt{\text{trace}(A^* A)}$.

Sin embargo, hay otra norma que con frecuencia viene: es la traza de la norma $\|A\|_1 = \text{trace}\left(\sqrt{A^* A}\right)$. Hay un sentido en el que esta norma inducida por el producto interior en $\mathbb{C}^n$, ya que si $A = xx^*$,, a continuación,$\|A\|_1 = \|x\|_2^2$.

Sin embargo, ¿qué es el "significado" de la traza de la norma? La distancia Euclídea y Frobenius normas tienen un significado intuitivo en un sentido geométrico, como la longitud de un vector. ¿Por qué nos preocupamos por la traza de la norma? Es precisamente porque es inducida por los "naturales" de la norma Euclídea en $\mathbb{C}^n$?

Además, si expresamos la traza de la norma en términos de los valores propios de $A$, corresponde a la L1 de la norma (es decir, la suma de los valores absolutos) de los valores singulares. ¿La L1 norma en $\mathbb{C}^n$, es decir,$\|x\|_1 = \sum_i |x_i|$, tiene alguna interpretación, y comparte cualquier similitud con la traza de la norma en $\mathbb{C}^{n\times n}$?

(Me disculpo si estas preguntas son básicas, les he hecho esta pregunta en Matemáticas StackExchange, y no recibieron respuesta, y no he podido encontrar ninguna información acerca de la intuición para estas normas y sus interrelaciones.)

30voto

ripper234 Puntos 39314

Uno de los posibles intuición para el seguimiento de la norma es como una manera de dar vuelta el rango de una matriz (que es muy discontinua) en una norma (que es continuo). Específicamente, el seguimiento de la norma es la única norma con la propiedad de que $\|P\|_{\mathrm{tr}} = \mathrm{rank}(P)$ por cada proyección ortogonal $P \in M_n(\mathbb{C})$.

Estrechamente relacionado con esto, la siguiente caracterización de la traza de la norma, que básicamente dice que $\|X\|_{\mathrm{tr}}$ mide la "cantidad de rank-1 matrices" que se necesita para la construcción de $X$: $$ \|X\|_{\mathrm{tr}} = \inf\big\{ \sum_j \|X_j\| : X = \sum_j X_j, \ \ \mathrm{rango}(X_j) = 1 \ \ \forall j \big\}. $$

Alternativamente, igual que el $\ell_1$-norma suele ser el "derecho" de la norma a utilizar cuando se trata con distribuciones de probabilidad (después de todo, queremos que las probabilidades para agregar a a $1$, no sus plazas para agregar a a $1$), el seguimiento de la norma suele ser el "derecho" de la norma a utilizar cuando se trata con su no-conmutativa analógico (densidad de matrices/estados cuánticos).

21voto

Otra respuesta es que el $M_n$, el espacio de $n\times n$ matrices complejas, lleva un operador de la norma , donde la norma de una matriz es su norma como un operador lineal de $\mathbb{C}^n$ a sí mismo (dar $\mathbb{C}^n$ norma euclídea). Para algunos de nosotros, esta es la forma más natural y útil, por norma,$M_n$.

Con el operador de la norma, $M_n$ es un finito dimensional espacio de Banach, por lo que tiene un doble espacio, que está a sólo $M_n$ equipada con traza de la norma. En infinitas dimensiones de la clase de seguimiento de los operadores en $H$, con seguimiento de la norma, de forma que el (único) predual de $B(H)$.

Edit: debo añadir algo acerca de cómo esto se relaciona con la $\ell^1$ norma. El operador de la norma de una matriz diagonal es el $\ell^\infty$ norma de sus entradas, por lo que el operador de la norma puede ser visto como una especie de generalización de $\ell^\infty$ norma. De hecho, $M_n$ con el operador de la norma contiene una isométrica copia de $\ell^\infty_n$ como la diagonal de las matrices. Así que es natural que el doble de la norma debe ser la $\ell^1$ norma en la diagonal de las matrices.

9voto

Karlo A. López Puntos 101

Si usted es interesante en la intuición geométrica, es el posible uno:

Cualquier matriz (operador) $A$ transforma una unidad de la pelota a un elipsoide. Singular valores de $A$ corresponden a las longitudes de elipsoide del eje, que la orientación es definida por los vectores singulares. Así que la nuclear norma representa la suma de las longitudes de elipsoide del eje.

También se puede jugar con el vínculo entre el $l_1$ norma y dispersión. Tener genetal aproximación problema : $$ \beta^* = argmin_{\beta}\|E(\beta)\|_1 = argmin_{\beta}\|A-M(\beta)\|_1 $$ el error de la matriz $E(\beta^*)$ probablemente tendrá algunos valores singulares de igual a 0, que no es el caso con $l_2$ norma.

No sé si todos estos hechos pueden ser útiles para usted, pero al menos da un poco de intuición acerca de esta norma.

7voto

Matthias Benkard Puntos 11264

La traza de la clase de la norma de $A$ es acerca de poner el $\ell^1$ norma en el singular de los valores de $A$, mientras que la de Hilbert-Schmidt norma usa $\ell^2$ lugar. Así que tu pregunta es básicamente: ¿por qué nos preocupamos por $\ell^1$, y no sólo a $\ell^2$? Las cosas se vuelven sólo interesante en infinitas dimensiones de los espacios, donde estos norma no son equivalentes más. Esta es la razón por la traza de la clase norma general surge cuando se considera compacto operadores que actúan en espacios de infinitas dimensiones. Libros como "Traza ideales y sus aplicaciones" de B. Simon le dirá más acerca de estos objetos, dependiendo de lo que estés buscando.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X