5 votos

Desigualdad de concavidad para la raíz cuadrada de la matriz

Dejemos que $A$ , $B$ y $C$ sean matrices simétricas y semidefinidas positivas. ¿Es cierto que $$ \|(A + C)^{1/2} - (B + C)^{1/2}\| \leq \|A^{1/2} - B^{1/2}\|,$$ en la norma de 2 o de Frobenius?

Es claramente cierto cuando $A, B$ y $C$ conmutar, pero el caso general me parece menos claro. De hecho, incluso el caso particular $B = 0$ no parece evidente.


Sin pérdida de generalidad, está claro que podemos suponer que $C$ es diagonal. Demostramos que es suficiente para demostrar la desigualdad para la matriz con ceros en todas partes excepto en cualquier posición $k$ en la diagonal, $$ (C_k)_{ij} = \begin{cases} 1 & \text{if } i=j=k\\ 0 & \text{otherwise} \end{cases} $$ Evidentemente, si la desigualdad es cierta para una $C_k$ es cierto para cualquier $C_k$ al voltear los ejes, y también para $C = \alpha C_k$ para cualquier $\alpha \geq 0$ porque \begin{align} \|(A + \alpha \, C_k)^{1/2} - (B + \alpha C_k)^{1/2}\| &= \sqrt{\alpha} \|(A/\alpha + C_k)^{1/2} - (B/\alpha + C_k)^{1/2}\| \\ &\leq \sqrt{\alpha} \|(A/\alpha)^{1/2} - (B/\alpha)^{1/2}\| = \sqrt{\alpha} \|A^{1/2} - B^{1/2}\| \end{align} Ahora, una diagonal general $C$ puede descomponerse como $C = \sum_{k=1}^{n} \alpha_k C_k$ . Aplicando la desigualdad anterior (especializada para una matriz $C$ con un solo elemento diagonal no nulo) repetidamente, podemos eliminar los elementos diagonales uno por uno \begin{align} &\|(A + \sum_{k=1}^{n}\alpha_k \, C_k)^{1/2} - (B + \sum_{k=1}^{n}\alpha_k \, C_k)^{1/2}\| \\ &\qquad = \|((A + \sum_{k=1}^{n-1}\alpha_k \, C_k) + \alpha_n C_n)^{1/2} - ((B + \sum_{k=1}^{n-1}\alpha_k \, C_k) + \alpha_n C_n)^{1/2}\| \\ &\qquad \leq \|(A + \sum_{k=1}^{n-1}\alpha_k \, C_k)^{1/2} - (B + \sum_{k=1}^{n-1}\alpha_k \, C_k)^{1/2}\| \\ &\qquad \leq \|(A + \sum_{k=1}^{n-2}\alpha_k \, C_k)^{1/2} - (B + \sum_{k=1}^{n-2}\alpha_k \, C_k)^{1/2}\| \\ &\qquad \leq \dots \leq \sqrt{\alpha} \|A^{1/2} - B^{1/2}\|. \end{align}


Aquí hay tres formas de demostrar la desigualdad en 1 dimensión, que he intentado generalizar al caso multidimensional sin éxito. Escribamos $a$ , $b$ , $c$ en lugar de $A$ , $B$ , $C$ , para enfatizar que estamos trabajando en una dimensión, y supongamos sin pérdida de generalidad que $a \leq b$ .

  • Escribamos: $$ f(c) = \sqrt{b + c} - \sqrt{a + c} $$ Calculamos que la derivada de $f$ viene dada por $$ f'(c) = \frac{1}{2} \left( \frac{1}{\sqrt{b + c}} - \frac{1}{\sqrt{a + c}} \right) \leq 0, $$ y así $f(c) = f(0) + \int_{0}^{c} f'(x) \, d x \leq f(0)$ .

  • Tenemos, por el teorema fundamental del cálculo y un cambio de variable \begin{align} \sqrt{b + c} - \sqrt{a + c} &= \int_{a + c}^{b + c} \frac{1}{2 \sqrt{x}} \, d x = \int_{a}^{b} \frac{1}{2 \sqrt{x + c}} \, d x \\ &\leq \int_{a}^{b} \frac{1}{2 \sqrt{x}} \, d x = \sqrt{b} - \sqrt{a}. \end{align}

  • Elevando al cuadrado los dos lados de la desigualdad, obtenemos $$ a + c - 2 \sqrt{a+ c} \, \sqrt{b + c} + b + c \leq a + b - 2 \sqrt{a} \sqrt{b}. $$ Simplificación y reordenación, $$ c + \sqrt{a} \sqrt{b} \leq \sqrt{a+ c} \, \sqrt{b + c} . $$ Volver a cuadrar $$ \require{cancel} \cancel{c^2 + a b} + 2 c \sqrt{a b} \leq \cancel{c^2 + ab} + ac + bc, $$ lo que lleva a $$ a + b - 2 \sqrt{ab} = (\sqrt{b} - \sqrt{a})^2 \geq 0$$ .

Los experimentos numéricos sugieren que la desigualdad es cierta tanto en la norma 2 como en la de Frobenius. (Una realización de) el siguiente código imprime 0,9998775.

import numpy as np
import scipy.linalg as la

n, d, ratios = 100000, 3, []
for i in range(n):
    A = np.random.randn(d, d)
    B = np.random.randn(d, d)
    C = .1*np.random.randn(d, d)
    A, B, C = A.dot(A.T), B.dot(B.T), C.dot(C.T)
    lhs = la.norm(la.sqrtm(A + C) - la.sqrtm(B + C), ord='fro')
    rhs = la.norm(la.sqrtm(A) - la.sqrtm(B), ord='fro')
    ratios.append(lhs/rhs)

print(np.max(ratios))

1voto

Cory Schires Puntos 696

He aquí una respuesta parcial, que muestra que $$ \|(A + C)^{1/2} - (B + C)^{1/2}\| \leq c \|A^{1/2} - B^{1/2}\|,$$ para una constante $c$ que sólo depende de la dimensión del problema. Abajo, $c$ denota cualquier constante que depende sólo de la dimensión, y puede cambiar de línea a línea.

Paso 1 : demostramos que, para matrices semidefinidas positivas simétricas, $$ d(A, B) = \sup_{\|x\| = 1} \left| \|Ax\| - \|Bx\| \right| = \sup_{\|x\| = 1} \left| \sqrt{x^TA^2 x} - \sqrt{x^T B^2 x} \right| $$ define una distancia equivalente a cualquier norma matricial. Lo demostramos para la norma 2 habitual. Se muestra en este puesto que $$ \| A - B \| \leq C\, d(A, B), $$ para una constante $C$ dependiendo sólo de la dimensión, por lo que tenemos que demostrar sólo que $$ d(A, B) \leq C \| A-B \|, $$ lo que se deduce de tomar el supremacía en la siguiente ecuación, donde empleamos la desigualdad del triángulo: $$ | \|Ax\| - \|Bx\| | \leq \|Ax - Bx\| = \|(A - B)x\| \leq \|A -B\| \|x\| = \|A - B\|. $$

Paso 2 : En vista de Paso 1 basta con mostrar $$ d( (A + C)^{1/2}, (B + C)^{1/2} ) \leq d(A^{1/2}, B^{1/2}), $$ que a su vez se desprende de $$ \left| \sqrt{x^T (A + C) x} - \sqrt{x^T (B + C) x} \right| \leq \left| \sqrt{x^TA x} - \sqrt{x^T B x} \right|. $$ Dejar $a = x^TAx$ , $b = x^T B x$ y $c = x^T C x$ esta ecuación se puede reescribir como $$ \left| \sqrt{a+c} - \sqrt{b + c} \right| \leq \left| \sqrt{a} - \sqrt{b} \right|, $$ lo cual sabemos que es cierto por el caso unidimensional.

1voto

River Li Puntos 101

No es una respuesta . Me gustaría discutir algunos problemas equivalentes.

Dejemos que $\mathbb{S}^n_{\succeq 0}$ denotan el conjunto de $n\times n$ matrices semidefinidas positivas y simétricas reales. Tenemos \begin{align} &\|(A+C)^{1/2} - (B+C)^{1/2}\| \le \|A^{1/2} - B^{1/2}\|, \quad \forall A, B, C \in \mathbb{S}^n_{\succeq 0} \tag{1}\\ \Leftrightarrow \quad &\|(A+uu^T)^{1/2} - (B+uu^T)^{1/2}\| \le \|A^{1/2} - B^{1/2}\|, \quad \forall A, B\in \mathbb{S}^n_{\succeq 0}, \quad \forall u\in \mathbb{R}^n\tag{2}\\ \Leftrightarrow \quad &\|(A+\mathrm{diag}(u^Tu, 0, \cdots, 0))^{1/2} - (B+\mathrm{diag}(u^Tu, 0, \cdots, 0))^{1/2}\| \le \|A^{1/2} - B^{1/2}\|, \\ &\qquad \forall A, B\in \mathbb{S}^n_{\succeq 0}, \quad \forall u\in \mathbb{R}^n\tag{3}\\ \Leftrightarrow \quad &\|(A+\mathrm{diag}(1, 0, \cdots, 0))^{1/2} - (B+\mathrm{diag}(1, 0, \cdots, 0))^{1/2}\| \le \|A^{1/2} - B^{1/2}\|,\\ & \qquad \forall A, B\in \mathbb{S}^n_{\succeq 0}.\tag{4} \end{align} Por lo tanto, basta con demostrar que $$\|(A+\mathrm{diag}(1, 0, \cdots, 0))^{1/2} - (B+\mathrm{diag}(1, 0, \cdots, 0))^{1/2}\| \le \|A^{1/2} - B^{1/2}\|.$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X