Hace un tiempo, quise ver si la noción de la media aritmética-geométrica podría extenderse a un par de matrices simétricas positivas definidas. (Sólo he considerado las matrices definidas positivas, ya que la noción de raíz cuadrada de la matriz es un poco intrincada para otros tipos de matrices).
Esperaba que surgieran algunas complicaciones, ya que, a diferencia de la multiplicación escalar, la multiplicación matricial no es conmutativa. Otra complicación sería que el producto de dos matrices simétricas no tiene por qué ser simétrico (aunque se mantiene la definición positiva, por lo que se puede seguir hablando de una raíz cuadrada de matriz principal).
Por analogía con el AGM escalar, consideré la iteración
$$\mathbf A_0=\mathbf A \; ; \; \mathbf B_0=\mathbf B$$ $$\mathbf A_{i+1}=\frac12(\mathbf A_i+\mathbf B_i) \; ; \; \mathbf B_{i+1}=\sqrt{\mathbf A_i \mathbf B_i}$$
He puesto en marcha un corto Mathematica rutina:
matAGM[u_, v_] := First[FixedPoint[
{Apply[Plus, #]/2, MatrixPower[Apply[Dot, #], 1/2]} &, {u, v}]] /;
MatrixQ[u, InexactNumberQ] && MatrixQ[v, InexactNumberQ]
y decidí probarlo con matrices de SPD generadas aleatoriamente.
(Una nota numérica: Mathematica utiliza la descomposición de Schur numéricamente estable en el cálculo de funciones matriciales como la raíz cuadrada de la matriz).
Encontré que para todos los pares de matrices SPD generados aleatoriamente que probé, el proceso era convergente (aunque la tasa de convergencia no es aparentemente tan rápida como la AGM escalar). Como era de esperar, el orden es importante: matAGM[A, B]
y matAGM[B, A]
no suelen ser iguales (y ambos resultados son unsymmetric ) a menos que A
y B
conmutan (para el caso especial de la diagonal A
y B
el resultado es la matriz diagonal cuyas entradas son las medias aritméticas-geométricas de las entradas correspondientes del par).
Ahora tengo tres preguntas:
-
¿Cómo puedo demostrar o refutar que este proceso converge para cualquier par de matrices SPD? Si es convergente, ¿cuál es la tasa de convergencia?
-
¿Existe alguna relación entre
matAGM[A, B]
ymatAGM[B, A]
si las dos matricesA
yB
¿no se desplaza? -
¿Existe alguna relación entre esta media aritmético-geométrica matricial y la media aritmético-geométrica escalar habitual? ¿Tendrían algo que ver, por ejemplo, las medias aritmético-geométricas de los valores propios de las dos matrices?
(añadido el 8/12/2011)
Indagando más me he convencido de que, efectivamente, debería considerar la formulación de la media geométrica por Pusz y Woronowicz :
$$\mathbf A\#\mathbf B=\mathbf A^{1/2}(\mathbf A^{-1/2}\mathbf B\mathbf A^{-1/2})^{1/2}\mathbf A^{1/2}$$
como más natural; la prueba de convergencia se simplifica entonces, como se muestra en el artículo que Willie enlazó. Sin embargo, todavía me pregunto por qué la formulación original "no natural" parece ser convergente (o bien, me gustaría ver un par de matrices SPD que causan problemas para la iteración no natural). También me interesa saber cómo pueden aparecer aquí las integrales elípticas, al igual que en la versión escalar de la AGM.