37 votos

¿Por qué la minimización de la norma nuclear de una matriz es un buen sustituto de la minimización del rango?

Un método llamado "Robust PCA" resuelve el problema de descomposición de la matriz

$$L^*, S^* = \arg \min_{L, S} \|L\|_* + \|S\|_1 \quad \text{s.t. } L + S = X$$

como un sustituto del problema real

$$L^*, S^* = \arg \min_{L, S} rank(L) + \|S\|_0 \quad \text{s.t. } L + S = X,$$ es decir, el objetivo real es descomponer la matriz de datos $X$ en una matriz de señal de bajo rango $L$ y una matriz de ruido dispersa $S$ . En este contexto: ¿por qué la norma nuclear es una buena aproximación al rango de una matriz? Se me ocurren matrices con baja norma nuclear pero con alto rango y viceversa. ¿Hay alguna intuición a la que se pueda apelar?

5 votos

Considere esta pregunta: ¿Por qué el $\ell_1$ norma un sustituto de $\ell_0$ ?

0 votos

Usted escribe "rango bajo" pero la fórmula tiene $\arg \max$ ...

0 votos

@LeonidKovalev: Oops. Por supuesto que quise decir $\min$ .

22voto

¿Por qué detección comprimida ¿trabajo? Porque el $\ell_1$ La bola de altas dimensiones es extremadamente "puntiaguda": es muy probable que los valores extremos de una función lineal en esta bola se alcancen en las caras de bajas dimensiones, las que están formadas por vectores dispersos. Cuando se aplica a las matrices, la escasez del conjunto de valores propios significa un rango bajo, como escribió @mrig antes que yo.

13voto

Ortund Puntos 108

Para ser exactos, se ha demostrado que el $\ell_1$ es la norma sobre convexo de la $\| \cdot \|_0$ pseudo-norma mientras que la norma nuclear es la sobre convexo del rango.

Como recordatorio, la envolvente convexa es el sustituto convexo más ajustado de una función. Una propiedad importante es que una función y su envolvente convexa tienen la misma minimizador global .

12voto

grafthez Puntos 201

La norma nuclear puede considerarse como una relajación convexa del número de valores propios distintos de cero (es decir, el rango).

10voto

Tom Puntos 16

La norma nuclear de una matriz es equivalente a la norma L1 del vector de sus valores propios. Por lo tanto, se está inyectando la sparsity al vector de valores propios. Básicamente, esta dispersión significa que se está reduciendo el rango de la matriz original.

1voto

dingo Puntos 11

Gracias por hacer esta pregunta. Tengo problemas para entender lo mismo. En particular, lo siguiente.

Aunque la norma nuclear es una relajación para el rango, no entiendo cómo la norma nuclear puede funcionar como sustituto para minimizar el rango a menos que sea un límite superior para el rango.

Como se señaló en el post original, la norma nuclear no parece proporcionar un límite (inferior o superior) al rango de la matriz. Por ejemplo, considere lo siguiente.

1)
A: #<BASIC-MATRIX (2 2)      2.00000      0.00000 \\
                             0.00000      2.00000 >
 (RANK A): 2
 (NUCLEAR-NORM A): 4.0d0

2)
 A: #<BASIC-MATRIX (2 2)      0.10000      0.00000 \\
                              0.00000      0.10000 >
 (RANK A): 2
 (NUCLEAR-NORM A): 0.20000000298023224d0

En 1) la norma nuclear es mayor que el rango mientras que en 2) es menor que el rango.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X