No estoy seguro de que podamos hacer comentarios sobre el comportamiento limitador. Pero sí podemos decir algo sobre lo que ocurre en el límite p=0 .
En p=0 se intenta minimizar el número de entradas distintas de cero en el vector e=y-Ax . Así, la función objetivo toma los valores del conjunto \{0,1,2,\dots,n\} . El mínimo ideal es cero, es decir, cuando y=Ax y el máximo es n lo que ocurre cuando ninguna de las entradas de e son ceros, lo que significa que y_i\neq [Ax]_i,~\forall i ( i^{th} entrada). Intentaré abordarlo caso por caso.
Consideremos el caso A=I . En el límite p=0 Usted está tratando de minimizar el l_0 norma (es decir, número de entradas distintas de cero) en el vector diferencia e=y-x . Pero también tiene la restricción adicional de que ||x||^2_2=1 . Si y era norma unitaria, entonces x=y es la solución óptima. Si no lo es, hay que poner a cero las entradas de y tanto como sea posible, ya que su objetivo es disminuir el número de entradas distintas de cero. La solución obvia (aunque se me escapa una prueba rigurosa) es poner a cero todas las entradas más pequeñas (en sentido absoluto) de y tales que su suma al cuadrado sea menor o igual que 1. Así, se pone a cero el máximo número de entradas distintas de cero.
Consideremos el caso A=D donde D es una matriz diagonal. Defina z=Dx . Así que hay que reducir a cero las entradas del vector e=y-z . Supongamos que todas las entradas diagonales de D son distintos de cero. Ahora viene una observación importante. Para cualquier vector r El l_o norma de r es lo mismo que Dr . Así que ||y-Dx||_0=||D(D^{-1}y-x)||_0=||D^{-1}y-x||_0 . D^{-1}y es un vector conocido, y ahora se sigue el método anterior para el caso de la matriz identidad.
No es necesario leer después de esto, todavía está en desarrollo :). Acabo de garabatear mis pensamientos aquí.
Consideremos el caso A es tal que A^TA es diagonal. A continuación, haga la observación de que A debe ser de la forma A=UD donde U es una matriz ortogonal y D es una matriz diagonal. Defina v=U^Ty-Dx Observe que ||y-UDx||_0=||U(U^Ty-Dx)||_0=||Uv||_0 . Ahora bien, ¿cuándo se minimiza esto (si uno se olvida de las restricciones). Una posibilidad es Uv=0 por lo que se obtiene el mínimo como 0. Esto no es posible porque U es ortogonal. ¿Cuál es la siguiente mejor respuesta, puede ||Uv|| ser tal que sólo una de las entradas de sea distinta de cero?. Ahora una interpretación de U es que es una matriz ortogonal, así como una matriz de rotación y también preserva la norma.