6 votos

Resolver la ecuación con la variable matriz

Quiero resolver una matriz $\Omega$ de una ecuación $\sum_k (\Omega + \Theta_k)^{-1} = Q$ . El $Q$ y $\Theta, \forall k=1...K$ son conocidas, y son matrices definidas positivas. $\Omega$ También tiene que ser positiva definida. Todas las matrices son grandes (algunos miles de columnas y filas). Mis preguntas son

(1) ¿Existe una solución de forma cerrada? ¿Cómo puedo simplificar la suma de la inversa de dos matrices?

(2) Me parece bien optar por una solución numérica. Pero, ¿cómo puedo definir este problema? Un problema de optimización para minimizar algo como $f(\Omega) = ||\sum_k (\Omega + \Theta_k)^{-1} - Q||$ ? ¿Necesito minimizar la norma de frobenius, (al igual que minimizar la norma L-2 en un problema de mínimos cuadrados)? Teniendo en cuenta la restricción de que $\Omega$ es definida positiva, ¿puedo resolverla mediante programación semidefinida? ¿Cómo puedo redefinir el problema en una programación lineal/semidefinida? No tengo muchos conocimientos de programación lineal. Preferiría un descenso de gradiente general en lugar de LP. Pero me parece bien usar LP si sé cómo hacerlo.

Este problema proviene de la estimación de la matriz de covarianza inversa de la distribución gaussiana multivariante.

EDITAR: Ambos $\Theta_k$ y $\Omega$ son escasos, si eso ayuda.

6voto

Daryl Puntos 41

He aquí una solución parcial a la primera pregunta del post original. Veamos la ecuación \begin{equation}\tag{1} \sum\nolimits_{i=1}^m (X+ \Theta_i)^{-1} = Q. \end{equation}

Lema (Existencia). Si todos los $\Theta_i$ son (estrictamente) definidos positivos, entonces (1) tiene una solución semidefinida positiva sólo si $Q \preceq \sum_i \Theta_i^{-1}$ .

Prueba. Supongamos que $Q=\sum_i \Theta_i^{-1}$ entonces claramente $X=0$ es la solución. Desde, $(X+\Theta_i)^{-1} \preceq \Theta_i^{-1}$ para cualquier $X \succeq 0$ Al resumir, vemos que $Q \preceq \sum_i \Theta_i^{-1}$ debe mantener. Además, en este caso, si existe una solución, ésta debe ser estrictamente definida positiva. Un pequeño argumento adicional muestra que en este caso, debe existir una única solución definida positiva.

Este lema demuestra que en el caso $Q$ no satisface el requisito, la ecuación original no tiene solución, y podría ser preferible minimizar $\|\sum_i (X+\Theta_i)^{-1}-Q\|_F^2$ en su lugar.

Lema (Límites). Cualquier solución factible de (1) debe estar en el conjunto $\Omega := [0, mQ^{-1}]$ .

Prueba. El límite inferior $X \succeq 0$ es evidente. Siguiendo un argumento similar al lema anterior, vemos que $Q=\sum_i (X+\Theta_i)^{-1} \preceq \sum_i X^{-1}$ lo que implica que $m X^{-1} \succeq Q$ , o de forma equivalente, $X \preceq m Q^{-1}$ .

Idea Ahora que tenemos un conjunto compacto $\Omega$ sólo tenemos que establecer un mapa no lineal estrictamente contractivo $G : \Omega \to \Omega$ . No he demostrado la contracción estricta del mapa a continuación, pero numéricamente parece funcionar. Como se puede sospechar de los lemas anteriores, la tasa de convergencia depende de $\|Q-\sum_i \Theta_i^{-1}\|$ , de modo que para valores pequeños de esta cantidad, la iteración converge más lentamente.

Supongamos que $X \succ 0$ . Denote por $S^{++}$ el conjunto de $n\times n$ matrices estrictamente definidas positivas. Entonces, definamos el mapa no lineal $\mathcal{G} : S^{++} \to S^{++}$ como \begin{equation*} \mathcal{G} = X \mapsto X^{1/2}\left(\sum\nolimits_{i=1}^m Q^{-1/2}(X+\Theta_i)^{-1}Q^{-1/2}\right)X^{1/2}. \end{equation*}

TODO Si tengo tiempo, podría pensar en demostrar que el mapa anterior genera soluciones convergentes. O bien se puede idear alguna otra iteración de punto fijo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X