No estoy seguro de que podamos hacer comentarios sobre el comportamiento limitador. Pero sí podemos decir algo sobre lo que ocurre en el límite $p=0$ .
En $p=0$ se intenta minimizar el número de entradas distintas de cero en el vector $e=y-Ax$ . Así, la función objetivo toma los valores del conjunto $\{0,1,2,\dots,n\}$ . El mínimo ideal es cero, es decir, cuando $y=Ax$ y el máximo es $n$ lo que ocurre cuando ninguna de las entradas de $e$ son ceros, lo que significa que $y_i\neq [Ax]_i,~\forall i$ ( $i^{th}$ entrada). Intentaré abordarlo caso por caso.
Consideremos el caso $A=I$ . En el límite $p=0$ Usted está tratando de minimizar el $l_0$ norma (es decir, número de entradas distintas de cero) en el vector diferencia $e=y-x$ . Pero también tiene la restricción adicional de que $||x||^2_2=1$ . Si $y$ era norma unitaria, entonces $x=y$ es la solución óptima. Si no lo es, hay que poner a cero las entradas de $y$ tanto como sea posible, ya que su objetivo es disminuir el número de entradas distintas de cero. La solución obvia (aunque se me escapa una prueba rigurosa) es poner a cero todas las entradas más pequeñas (en sentido absoluto) de $y$ tales que su suma al cuadrado sea menor o igual que 1. Así, se pone a cero el máximo número de entradas distintas de cero.
Consideremos el caso $A=D$ donde $D$ es una matriz diagonal. Defina $z=Dx$ . Así que hay que reducir a cero las entradas del vector $e=y-z$ . Supongamos que todas las entradas diagonales de $D$ son distintos de cero. Ahora viene una observación importante. Para cualquier vector $r$ El $l_o$ norma de $r$ es lo mismo que $Dr$ . Así que $||y-Dx||_0=||D(D^{-1}y-x)||_0=||D^{-1}y-x||_0$ . $D^{-1}y$ es un vector conocido, y ahora se sigue el método anterior para el caso de la matriz identidad.
No es necesario leer después de esto, todavía está en desarrollo :). Acabo de garabatear mis pensamientos aquí.
Consideremos el caso $A$ es tal que $A^TA$ es diagonal. A continuación, haga la observación de que $A$ debe ser de la forma $A=UD$ donde $U$ es una matriz ortogonal y $D$ es una matriz diagonal. Defina $v=U^Ty-Dx$ Observe que $||y-UDx||_0=||U(U^Ty-Dx)||_0=||Uv||_0$ . Ahora bien, ¿cuándo se minimiza esto (si uno se olvida de las restricciones). Una posibilidad es $Uv=0$ por lo que se obtiene el mínimo como 0. Esto no es posible porque $U$ es ortogonal. ¿Cuál es la siguiente mejor respuesta, puede ||Uv|| ser tal que sólo una de las entradas de sea distinta de cero?. Ahora una interpretación de $U$ es que es una matriz ortogonal, así como una matriz de rotación y también preserva la norma.