7 votos

¿El complemento de Schur preserva el orden parcial

Dejemos que $\begin{bmatrix} A_{1} &B_1 \\ B_1' &C_1 \end{bmatrix}$ , $\begin{bmatrix} A_2 &B_2 \\ B_2' &C_2 \end{bmatrix}$ sean matrices simétricas positivas definidas y estén conformes con la partición. Si $\begin{bmatrix} A_{1} &B_1 \\ B_1' &C_1 \end{bmatrix}-\begin{bmatrix} A_2 &B_2 \\ B_2' &C_2 \end{bmatrix}$ es semidefinido positivo, ¿es cierto que $(A_1-B_1C^{-1}_1B_1')-(A_2-B_2C^{-1}_2B_2')$ ¿también es semidefinido positivo? Aquí $X'$ significa la transposición de $X$ .

1 votos

El término más común es " Conforme partición". ;)

0 votos

Mi opinión es que la respuesta es sí, o se convierte en sí si se invierte el orden de la resta.

0 votos

Esto me hace ver que mi comprensión de las matrices de Wishart está oxidada. Si $W_1$ y $W_2$ son variables aleatorias valoradas matriciales independientes con una distribución de Wishart, entonces su suma también está distribuida por Wishart. Por tanto, si $W_1$ y $W_2-W_1$ están distribuidos por Wishart y son independientes, entonces $W_2$ está distribuido por Wishart. Y los complementos de Schur dentro de las matrices de Wishart también están distribuidos por Wishart. De eso estoy seguro, y mirando es.wikipedia.org/wiki/Distribución_de_Wishart Me sorprende que el término "complemento de Schur" no aparezca en ninguna parte del artículo.

5voto

Joseph Sturtevant Puntos 6597

Sí, así es. La suposición $$\begin{bmatrix} A_{1} &B_1 \\ B_1^T &C_1 \end{bmatrix}-\begin{bmatrix} A_2 &B_2 \\ B_2^T &C_2 \end{bmatrix} \geq 0$$ implica que para cualquier vector $\begin{pmatrix} x & y \end{pmatrix}$ ,

$$ \begin{pmatrix} x^T & y^T \end{pmatrix} \begin{bmatrix} A_{1} &B_1 \\ B_1^T &C_1 \end{bmatrix} \begin{pmatrix} x \\ y \end{pmatrix} \geq \begin{pmatrix} x^T & y^T \end{pmatrix} \begin{bmatrix} A_2 &B_2 \\ B_2^T &C_2 \end{bmatrix} \begin{pmatrix} x \\ y \end{pmatrix}~(*)$$ Pero para cualquier matriz particionada,

$$\begin{pmatrix} x^T & y^T \end{pmatrix} \begin{bmatrix} A &B \\ B^T &C \end{bmatrix} \begin{pmatrix} x \\ y \end{pmatrix} = (x + A^{-1} B y)^T A (x + A^{-1} B y) + y^T(C-B^T A^{-1} B)y.$$ Además, si la matriz dividida del lado izquierdo es definida positiva, entonces cada de los dos términos del lado derecho es positivo. Por lo tanto, la elección de un $y$ y $x = -A_1^{-1}B_1y$ en (*) da

$$y^T(C_1-B_1^T A_1^{-1} B_1)y \geq \mbox{ something positive} + y^T(C_2-B_2^T A_2^{-1} B_2)y,$$ lo que implica

$$y^T(C_1-B_1^T A_1^{-1} B_1)y \geq y^T(C_2-B_2^T A_2^{-1} B_2)y,$$

que implica la conclusión que quieres.

0 votos

Oops - Parece que he resuelto el otro complemento de Schur, es decir, el complemento de Schur del $(2,2)$ con respecto al bloque $(1,1)$ bloque. Me da pereza volver a escribir, y esto es, por supuesto, equivalente a la pregunta que haces.

0 votos

Interesante si entiendo bien, "algo positivo" es positivo porque $A_2$ es positiva definida -- parece que sólo has utilizado la definición positiva de $A_2$ ¿pero no la de la segunda matriz completa y no la de la primera matriz?

0 votos

@joriki - buena captura; tienes razón. Espero que mi prueba no sea errónea; parece que prueba demasiado, pero la he vuelto a revisar y no veo ningún error. Supongo que porque $A_2 \geq 0$ implica $A_1 \geq 0$ bajo los supuestos de la pregunta, sí parece plausible.

4voto

En la teoría de control, este tipo de desigualdades son omnipresentes y se manejan mediante el uso de complementos de Schur. Para completar, aquí está la versión no estricta de la fórmula del complemento de Schur, es una exageración pero la pregunta es un caso especial particular, así que aquí va:

Fórmula: Dejemos que $Q,R$ sean matrices simétricas. Entonces las siguientes son equivalentes:

  1. $$ \begin{pmatrix} Q &S\\ S^T &R \end{pmatrix} \succeq 0 $$

  2. $$\begin{align} R &\succeq 0\\ Q -SR^\dagger S^T &\succeq 0\\ S(I-RR^\dagger) &= 0 \end{align} $$ donde $R^\dagger$ es la Pseudoinversa de $R$ .


Ahora bien, si se cambia el nombre de su hipótesis que implica la diferencia de la matriz como $$ M_1 - M_2 := \begin{pmatrix} A_1 &B_1\\ B_1^T &C_1 \end{pmatrix} - \begin{pmatrix} A_2 &B_2\\ B_2^T &C_2 \end{pmatrix}\succeq 0$$

podemos reformular la hipótesis como la siguiente a través del segundo punto de la fórmula ( $Q=M_1,S=I,R=M_2^{-1}$ ): $$\begin{align} M_2^{-1} &\succeq 0 \quad \text{by definition}\\ M_1 - M_2 &\succeq 0\\ I (I-M_2M_2^{-1}) &= 0 \end{align} $$ por lo que tenemos $$ \begin{pmatrix} M_1 &I\\I&M_2^{-1} \end{pmatrix}\succeq 0 $$ Además, a partir de la fórmula de la inversa de una matriz, tenemos $$ M_2^{-1} = \begin{pmatrix} (A_2 - B_2C_2^{-1}B_2^T)^{-1} &\star\\ \star &\star \end{pmatrix} $$ Como mostró el usuario1551, se puede llevar la matriz $M_1$ en la forma de la siguiente mediante una transformación de congruencia y algunos reordenamientos: $$\begin{pmatrix} M_1 &I\\I&M_2^{-1} \end{pmatrix} \leadsto \left( \begin{array}{cc|cc} (A_1 - B_1C_1^{-1}B_1^T) &I &0 &0\\ I &(A_2 - B_2C_2^{-1}B_2^T)^{-1} &0 &\star\\ \hline 0 &0 &C_1 &I\\ 0&\star&I&\star \end{array}\right) \succeq 0 $$ El $(1,1)$ La matriz de bloques tiene el resultado deseado si aplicamos de nuevo la fórmula del complemento de Schur no estricto pero en sentido inverso.

Incorporación de última hora: Ahora que lo miro, no es tan bueno como pensaba inicialmente, pero no quería desperdiciar todo, así que espero que sirva de ayuda un $\epsilon$ .

0 votos

Gracias, puedo ver una prueba más sencilla: Usando $M_1\ge M_2$ equivale a $M_2^{-1}\ge M_1^{-1}$ . Así, $M_2^{-1} = \begin{pmatrix} (A_2 - B_2C_2^{-1}B_2^T)^{-1} &\star\\ \star &\star \end{pmatrix}$ ...

0 votos

@Sunni : Ah, sí. Es un atajo inteligente.

2voto

Chris Ballance Puntos 17329

Para una matriz de bloques general $X=\begin{pmatrix}A&B\\C&D\end{pmatrix}$ el complemento de Schur $S$ al bloque $D$ satisface $$ \begin{pmatrix}A&B\\C&D\end{pmatrix} =\begin{pmatrix}I&BD^{-1}\\&I\end{pmatrix} \begin{pmatrix}S\\&D\end{pmatrix} \begin{pmatrix}I\\D^{-1}C&I\end{pmatrix}. $$ Así, cuando $X$ es hermitiana, $$ \begin{pmatrix}A&B\\B^\ast&D\end{pmatrix} =\begin{pmatrix}I&Y^\ast\\&I\end{pmatrix} \begin{pmatrix}S\\&D\end{pmatrix} \begin{pmatrix}I\\Y&I\end{pmatrix}\ \textrm{ for some } Y. $$ Por lo tanto, $$ \begin{eqnarray} &&\begin{pmatrix}A_1&B_1\\B_1^\ast&D_1\end{pmatrix} \ge\begin{pmatrix}A_2&B_2\\B_2^\ast&D_2\end{pmatrix} \\ &\Rightarrow& \begin{pmatrix}S_1\\&D_1\end{pmatrix} \ge \begin{pmatrix}I&Z^\ast\\&I\end{pmatrix} \begin{pmatrix}S_2\\&D_2\end{pmatrix} \begin{pmatrix}I\\Z&I\end{pmatrix}\ \textrm{ for some } Z\\ &\Rightarrow& (x^\ast,0)\begin{pmatrix}S_1\\&D_1\end{pmatrix}\begin{pmatrix}x\\0\end{pmatrix} \ge (x^\ast,\ x^\ast Z^\ast) \begin{pmatrix}S_2\\&D_2\end{pmatrix} \begin{pmatrix}x\\Zx\end{pmatrix},\ \forall x\\ &\Rightarrow& x^\ast S_1 x \ \ge\ x^\ast S_2 x + (Zx)^\ast D_2 (Zx) \ \ge\ x^\ast S_2 x,\ \forall x\\ &\Rightarrow& S_1\ge S_2. \end{eqnarray} $$

Editar: En retrospectiva, esto es esencialmente idéntico a la prueba de Alex.

0 votos

Esta sería una prueba estándar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X