5 votos

Prueba misteriosa sobre normas inducidas (era: Unicidad de SVD)

Para demostrar la no unicidad de los vectores singulares cuando hay un valor singular repetido, el libro (Trefethen), argumenta lo siguiente: Sea $\sigma$ es el primer valor singular de A, y $v_{1}$ el vector singular correspondiente. Sea $w$ sea otro vector linealmente independiente tal que $||Aw||=\sigma$ y construir un tercer vector $v_{2}$ perteneciente al tramo de $v_{1}$ y $w$ y ortogonal a $v_{1}$ . Los tres vectores son unitarios, por lo que $w=av_{1}+bv_{2}$ con $|a|^2+|b|^2=1$ y $v_{2}$ se construye (al estilo Gram-Schmidt) como sigue:

$$ {v}_{2}= \dfrac{{w}-({v}_{1}^{T} w ){v}_{1}}{|| {w}_{1}-({v}_{1}^{T} {w} ){v}_{1} ||_{2}}$$

Ahora, dice Trefethen, $||A||=\sigma$ Así que $||Av_{2}||\le \sigma$ pero esto debe ser una igualdad (y por lo tanto $v_{2}$ es otro vector singular relativo a $\sigma$ ), ya que de lo contrario tendríamos $||Aw||<\sigma$ en contraste con la hipótesis.

¿Cómo? No veo ninguna aplicación elemental de la desigualdad triangular o de la desigualdad de Schwarz para demostrar esta afirmación.

Estoy bastante convencido de la no unicidad parcial de la SVD en determinadas situaciones. Otras pruebas son factibles, pero quiero entender este paso algebraico específico de esta prueba específica.

Gracias.

4voto

user15381 Puntos 32

En realidad es muy sencillo. El punto principal (aparentemente perdido por el OP) es que $Av_1$ y $Av_2$ deben ser ortogonales (esto es algo obvio para las personas familiarizadas con las pruebas de SVD, porque la inducción se descompone en espacios ortogonales).

Por cada $z\in{\mathbb C}$ , tienes

$$ ||A(v_2+zv_1)||^2 \leq \sigma^2 ||v_2+zv_1||^2 \tag{1} $$

Ampliando, se obtiene

$$ ||Av_2||^2+2{\sf Re}\bigg(\bar{z}\big<Av_2,Av_1\big>\bigg)+|z|^2||Av_1||^2 \leq \sigma^2 (||v_2||^2+|z|^2||v_1||^2) \tag{2} $$

que se simplifica en

$$ 2{\sf Re}\bigg(\bar{z}\big<Av_2,Av_1\big>\bigg) \leq \sigma^2||v_2||^2-||Av_2||^2 \tag{3} $$

Dejar $z=\big<Av_2,Av_1\big>t$ con $t\in{\mathbb R}$ deducimos que $2t\Big|\big<Av_2,Av_1\big>\Big|^2 \leq \sigma^2||v_2||^2-||Av_2||^2$ y esto es posible sólo si $\big<Av_2,Av_1\big>=0$ . Entonces tenemos, para cualquier $a,b$ con $|a|^2+|b|^2=1$ y $b\neq 0$ ,

$$ \sigma^2||av_1+bv_2||^2-||A(av_1+bv_2)||^2= |b|^2 (\sigma^2||v_2||^2-||Av_2||^2) \tag{4} $$

Así que $||Aw||=\sigma||w||$ fuerzas $||Av_2||=\sigma||v_2||$ .

2voto

Markus Scheuer Puntos 16133

Nota: Tenga en cuenta que esta respuesta era inicialmente incorrecta. Gracias a littleO que llaman la atención sobre mi error. El argumento esencial al final se basa ahora en la respuesta ya expuesta por Ewan Delanoy . Así que, de hecho, la prueba de Trefethen sigue siendo misterioso para mí también :-;


No estoy seguro de que los argumentos de Trefethen sobre la parte de la prueba que te interesa sean suficientes.

Para poder considerar el texto con detenimiento, en el párrafo siguiente se cita textualmente la parte pertinente de la demostración del Teorema 4.1 de su Álgebra lineal numérica .

De Numerical Linear Algebra, parte de la demostración del teorema 4.1 (Trefethen):

En primer lugar, observamos que $\sigma_1$ se determina unívocamente por la condición de que sea igual a $\left\Vert A\right\Vert_2$ como se deduce de $(4.4)$ . Supongamos ahora que, además de $v_1$ existe otro vector linealmente independiente $w$ con $\left\Vert w\right\Vert_2=1$ y $\left\Vert Aw\right\Vert_2=\sigma_1$ . Definir un vector unitario $v_2$ ortogonal a $v_1$ como combinación lineal de $v_1$ y $w$ , $$v_2=\frac{w-\left(v_1^{\ast}w\right)v_1}{\left\Vert w_1-\left(v_1^{\ast}w\right)v_1\right\Vert_2}$$ Desde $\left\Vert A\right\Vert_2=\sigma_1$ , $\left\Vert Av_2\right\Vert_2\leq\sigma_1$ pero esto debe ser una igualdad, porque de lo contrario, ya que $w=v_{1}c+v_{2}s$ para algunas constantes $c$ y $s$ con $\left\vert c\right\vert^2+\left\vert s\right\vert^2=1$ tendríamos $\left\Vert Aw\right\Vert_2<\sigma_1$ .

Analicemos los argumentos de Trefethen con relativo detalle:

Primer paso: Situación inicial

Sabemos desde el principio de la prueba (no expuesto aquí) que existe un vector $v_1$ con $\left\Vert v_1\right\Vert_2=1$ y también fijamos $\sigma_1=\left\Vert A\right\Vert_2$ . De acuerdo con el texto anterior, suponemos además que este vector es un vector singular con $\left\Vert Av_1\right\Vert_2=\sigma_1$ .

Segundo paso: Unicidad mediante argumento indirecto

Consideramos ahora (argumento indirecto) cualquier vector $w$ que es linealmente independiente de $v_1$ y que cumple además $v_1$ , $\left\Vert w\right\Vert_2=1$ y $\left\Vert Aw\right\Vert_2=\sigma_1$ .

Tercer paso (idea principal de la prueba): Crear un vector singular $v_2$ violando el supuesto de distinción de los valores singulares establecido en el teorema

Partiendo de la base de que $\left\Vert Aw\right\Vert_2=\sigma_1$ creamos un segundo vector singular $v_2$ que también cumple $\left\Vert Av_2\right\Vert_2=\sigma_1$ por lo que viola la condición previa de distinción de los valores singulares.

Desde $v_1$ y $w$ son linealmente independientes, podemos crear (por ejemplo, con Gram-Schmidt) un vector $v_2$ con $\left\Vert v_2\right\Vert =1$ y que es ortogonal a $v_1$ . Dado que todos los vectores $u$ con $\left\Vert u\right\Vert =1$ cumplen por definición (del supremum) $\left\Vert Au\right\Vert_2 \leq \left\Vert A\right\Vert_2$ obtenemos $\left\Vert Av_2\right\Vert_2 \leq \left\Vert A\right\Vert_2=\sigma_1$ .

Ahora, con la ayuda de $w$ w $v_2$ incluso tiene que cumplir $\left\Vert Av_2\right\Vert_2 = \left\Vert A\right\Vert_2=\sigma_1$ ya que si no $\left\Vert Av_2\right\Vert_2 <\sigma_1$ obtenemos

\begin{align} \left\Vert Aw_2\right\Vert_2^{2}&=\left\Vert A(c v_1+s v_2)\right\Vert^{2}_2\\ &\leq\left\vert c\right\vert^2\left\Vert Av_1\right\Vert_2^2+2\mathsf{Re}\left(c\bar{s}\left<Av_1,Av_2\right>\right)+\left\vert s\right\vert^2\left\Vert Av_2\right\Vert_2^2\\ &=\left\vert c\right\vert^2\sigma_1^2+\left\vert s\right\vert^2\underbrace{{\left\Vert Av_2\right\Vert_2^2}}_{<\sigma_1^2}\qquad(\ast)\\ &<\sigma_1^2\left(\left\vert c\right\vert^2+\left\vert s\right\vert^2\right)\\ &=\sigma_1^2 \end{align}

y esto contradice nuestra suposición de que $\left\Vert Aw_2\right\Vert_2=\sigma_1$ .

Así que tenemos un segundo vector singular $v_2$ con $\left\Vert Av_2\right\Vert_2=\sigma_1$ y esto viola la condición de distinto valores singulares indicados en el teorema.


Tenga en cuenta que en la línea ( $\ast$ ) el argumento esencial de Ewan Delanoy que establece que $Av_1$ y $Av_2$ son ortogonales y por lo tanto el producto interior desaparece se utiliza. No veo un argumento adecuado en la prueba de Trefethen, que podría utilizar en su lugar.

2voto

Etienne Puntos 9562

El argumento de Trefethen es, en efecto, muy extraño.

Según he entendido en las respuestas anteriores, todo iría bien si se supiera que $Av_1$ y $Av_1$ son ortogonales.

Esto puede hacerse observando que puesto que $\sigma_1=\Vert A\Vert$ y $v_1$ es un vector unitario tal que $\Vert Av_1\Vert=\sigma_1$ entonces $v_1$ es un vector propio de $A^*A$ con valor propio $\sigma_1^2$ .

En efecto, tenemos $\sigma_1^2=\Vert Av_1\Vert^2=\langle A^*Av_1,v_1\rangle$ es decir $\langle (\sigma_1^2Id-A^*A)v_1,v_1\rangle=0$ . Dado que la forma sesquilínea $B(u,v)=\langle (\sigma_1^2Id-A^*A)u,v\rangle$ es semidefinida positiva (porque $\sigma_1^2=\Vert A\Vert^2=\Vert A^*A\Vert$ ) se deduce, por la desigualdad de Cauchy-Schwarz aplicada a $B$ que $(\sigma_1^2Id-A^*A)v_1=0$ es decir $A^*Av_1=\sigma_1^2v_1$ .

Los detalles para Cauchy-Schwarz son los siguientes: tenemos $B(v_1,v_1)=0$ por lo tanto por Cauchy-Schwarz: $$\vert B(v_1,u)\vert\leq B(v_1,v_1)^{^1/2}B(u,u)^{1/2}=0;$$ es decir, $B(v_1,u)=0$ para todos los vectores $u$ . Esto significa que $(\sigma_1^2Id-A^*A)v_1$ es ortogonal a todos y, por tanto, igual a $0$ .

Una vez que sepas que $A^*Av_1=\sigma_1^2v_1$ escriba simplemente $$\langle Av_1,Av_2\rangle=\langle A^*Av_1,v_2\rangle=\sigma_1^2\langle v_1,v_2\rangle=0\, .$$

Dicho esto, parece sin embargo mucho más sencillo demostrar que $\Vert Av_2\Vert=\sigma_1$ como sigue. Por el razonamiento anterior, $v_1$ y $w$ son ambos vectores propios de $A^*A$ con valor propio $\sigma_1^2$ . Por lo tanto, también lo es $v_2$ ya que $v_2$ es una combinación lineal de $v_1$ y $w$ . Así que tenemos $\Vert Av_2\Vert^ 2=\langle A^*Av_2,v_2\rangle=\langle\sigma_1^2v_2,v_2\rangle=\sigma_1^2$ según sea necesario.

Editar En realidad, no leí atentamente la respuesta de Ewan, ya que también está demostrando que $Av_1$ y $Av_2$ son ortogonales. De hecho, su argumento es el que se utiliza en la demostración de la desigualdad de Cauchy-Schwarz.

1voto

Dubious Puntos 1572

Esto no es una respuesta, pero es demasiado largo para un comentario. Supongamos que $||Av_2||=\sigma$ entonces:

$$\sigma^2=||A(w)||^2=\left<A(w),A(w)\right>=\left<aA(v_1)+bA(v_2),aA(v_1)+bA(v_2)\right>=$$ $$=a^2||A(v_1)||^2+b^2||A(v_2)||^2+2ab\left<A(v_1),A(v_2)\right>=\sigma^2+2ab\left<A(v_1),A(v_2)\right>$$

Pero esto es cierto cuando $A(v_1)$ y $A(v_2)$ son ortogonales; ¿ayuda este hecho?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X