Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

5 votos

Cómo probar para una matriz PSD λmin

Como dice el título, para A,B\in \mathbb{S}^n , B\ge 0 (PSD), cómo demostrar que \lambda_{\min} (A)\operatorname{tr}(B)\le \operatorname{tr}(AB) \le \lambda_{\max} (A)\operatorname{tr}(B).

Mi opinión

¿Es posible utilizar la eigendecomposición para demostrarlo?

0 votos

Es A ¿alguna matriz?

0 votos

@Arian Perdón, se me pasó la condición y he actualizado.

0 votos

Así que, \Bbb S^n es el conjunto de reales, simétricos, n \times n matrices, ¿verdad?

2voto

AreaMan Puntos 3568

Para cualquier matriz M, y base v_i , tr(M) = \Sigma v_i^T M v_i . Aplique esto a una base de vectores propios para A (que existe porque A es real y simétrico) para calcular tr(AB) . Tendrá que utilizar B PSD, en particular v^T B v no negativo, para conseguir que las desigualdades vayan en la dirección correcta.

Es decir, que v_i sea una base para A con la propiedad de que A v_i = \lambda_i v_i . Tenga en cuenta que debido a que A es simétrica, también tenemos v_i^T A = \lambda v_i^T

Entonces escribimos:

tr(AB) = \Sigma_{i = 1}^n v_i^T AB v = \Sigma_{i = 1}^n \lambda_i v_i^T B v_i \leq \Sigma \lambda_{max} v_i^T B v_i = \lambda_{max} \Sigma v_i^T B v_i = \lambda_{max} tr(B) .

(Nótese que para la desigualdad del medio, necesitábamos que v_i^T B v_i \geq 0 .)

El caso de \lambda_{min} es similar.

0 votos

¿Podría darme más detalles? ¿Cómo puedo obtener el valor propio del tr?

0 votos

@maple He añadido algunos detalles. Hazme saber si no está claro, por favor.

1voto

orangeskid Puntos 13528

SUGERENCIA:

Utilice lo siguiente: si C y B son PSD entonces \operatorname{tr}(CB)\ge 0 . De hecho, \operatorname{tr}(CB)=\operatorname{tr}(\sqrt{B}C\sqrt{B})\ge0 ..

Ahora, \lambda_{\max}(A)\cdot I-A \succeq 0 así que \operatorname{tr}(\, (\lambda_{\max}(A)\cdot I-A)B\,) \ge 0 Expandir y obtener la desigualdad del lado derecho .

1voto

Robert Lewis Puntos 20996

Supongo que la afirmación A, B \in \Bbb S^n debe interpretarse en el sentido de que tanto A y B son reales y simétricos, n \times n matrices. Además, asumo la afirmación de que B \ge 0 es decir B es una matriz PSD (semidefinida positiva) significa que para cualquier vector real x , x^TBx \ge 0 .

Desde A \in \Bbb S^n hay una matriz ortogonal O Es decir,

OO^T = O^TO = I, \tag 1

que diagonaliza A ; a continuación, podemos establecer

O^TAO = \Lambda = \text{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n) = [\lambda_i \delta_{ij}]; \tag 2

aquí el \lambda_i \in \Bbb R son, por supuesto, los valores propios de la matriz A .

Recordamos que las trazas matriciales son invariantes bajo transformaciones de similitud como A \to O^TAO = O^{-1}AO Por lo tanto

\operatorname{tr}(AB) = \text{tr}(O^TABO) = \text{tr} (O^TAOO^TBO), \tag 3

donde hemos utilizado (1) a la derecha de (3); si escribimos la matriz transformada O^TBO como

O^TBO = [b_{ij}], \tag 4

podemos combinar (2), (3) y (4) y obtener

\text{tr}(AB) = \text{tr}(O^TAOO^TBO) = \text{tr}(\Lambda [b_{ij}]) = \text{tr}([\lambda_i \delta_{ik}][b_{kj}]) = \text{tr}([\lambda_i b_{ij}]) = \displaystyle \sum_1^n \lambda_i b_{ii}. \tag 5

Ahora, como las columnas \vec e_i de una matriz ortogonal como O forman un conjunto ortonormal,

O = [\vec e_1 \; \vec e_2 \; \ldots \: \vec e_n ], \tag 6

un hecho que se manifiesta en (1), donde

O^T = \begin{bmatrix} \vec e_1^T \\ \vec e_2^T \\ \vdots \\ \vec e_n^T \end{bmatrix}, \tag 7

tenemos

[b_{ij}] = O^TBO = [\vec e_i^TB\vec e_j], \tag 8

de lo que se desprende que

b_{ii} = \vec e_i^T B \vec e_i \ge 0 \tag 9

desde B es semidefinido positivo; se deduce entonces que

\displaystyle \lambda_{min} \sum_1^n b_{ii} = \sum_1^n \lambda_{min} b_{ii} \le \sum_1^n \lambda_i b_{ii} \le \sum_1^n \lambda_{max} b_{ii} = \lambda_{max} \sum_1^n b_{ii}, \tag{10}

de donde

\lambda_{min} \text{tr}(B) \le \text{tr}(AB) \le \lambda_{max} \text{tr}(B); \tag{11}

0voto

Diego Mucciolo Puntos 38

Sí. Eigendecomposing A obtenemos A = U D U^T , donde U es una matriz ortogonal y D una matriz diagonal compuesta por los valores propios de A . Ahora bien, tenga en cuenta que \operatorname{tr}(A) = \operatorname{tr}(U D U^T) = \operatorname{tr}(D) \operatorname{tr}(B) = \operatorname{tr}(U^T B U) \operatorname{tr}(AB) = \operatorname{tr}(U^T A B U) = \operatorname{tr}(D U^T B U) y U^T B U \ge 0 ya que B \ge 0 . Entonces todos los elementos diagonales de U^T B U son no negativos. Así, \lambda_{\min}(A)\operatorname{tr}(B) = \lambda_{\min}(D)\operatorname{tr}(U^T B U) \le \operatorname{tr}(D U^T B U) = \operatorname{tr}(AB) y \operatorname{tr}(AB) = \operatorname{tr}(D U^T B U) \le \lambda_{\max}(D)\operatorname{tr}(U^T B U) = \lambda_{\max} (A)\operatorname{tr}(B)

0 votos

Gracias, pero ¿cómo podemos conseguir tr(U^TABU)=tr(DU^TBU) ?

0 votos

¿Por qué se escribe que los valores propios de A son no negativos? ¿Importa? ¡Salud!

1 votos

@maple Porque A = U D U^T y U^T U = I Así que U^T A = D U^T .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X