1 votos

Inversa de Moore-Penrose de una matriz deficiente en filas y columnas

Como se explica detalladamente en ¿Qué formas adopta la inversa de Moore-Penrose en sistemas con rango completo, rango completo de columnas y rango completo de filas? para un sistema de ecuaciones

$$Ax=b,$$

si $A$ es de rango completo en filas pero de rango deficiente en columnas (el sistema está bajo restricción), la inversa de Moore-Penrose de $A$ encuentra la solución de norma mínima para el sistema de ecuaciones, es decir

$$x=A^{+}b$$

es la solución de la ecuación original para la que $\|{x}\|_{2}$ es el más pequeño.

Por el contrario, si $A$ es de rango completo en columnas pero de rango deficiente en filas (el sistema está sobrecargado), la inversa de Moore-Penrose de $A$ encuentra la solución aproximada de error cuadrático mínimo del sistema de ecuaciones, es decir,

$$x=A^{+}b$$

es el $x$ para lo cual $\|Ax-b\|_{2}$ es el más pequeño.

¿Qué ocurre si $A$ es de rango deficiente tanto en filas como en columnas (por ejemplo, hay más columnas que filas, pero menos columnas independientes que filas)? ¿Acaban las minimizaciones de las normas actuando en secuencia, de modo que

$$x=A^{+}b$$

minimiza $\|x\|_{2}$ sobre todas las soluciones que minimizan $\|Ax-b\|_{2}$ o existe alguna interacción entre las minimizaciones de las normas de modo que no se pueden tomar en secuencia, y en su lugar $A^{+}b$ minimiza alguna norma combinada en los espacios de entrada y salida?

3voto

Christopher A. Wong Puntos 12513

Tienes razón, en el caso de deficiencia total de rango, $A^{\dagger}b$ es la solución de norma mínima al sistema lineal $Ax = b$ .

Esto se puede comprobar viendo $A^{\dagger}$ en términos de complementos ortogonales del espacio de alcance y nulo. Combinemos el $m \times n$ matriz $A$ con el transformación lineal $A$ que asigna $\mathbb{R}^n$ a $\mathbb{R}^m$ . Entonces el pseudoinverso $A^{\dagger}$ mapas $\mathbb{R}^m$ a $\mathbb{R}^n$ con la siguiente propiedad: si se descompone $\mathbb{R}^m = R(A) \oplus R(A)^{\perp}$ entonces $A^{\dagger}$ mapas $R(A)$ a $\ker(A)^{\perp}$ y mapas $R(A)^{\perp}$ a $0$ .

A continuación, examinamos $Ax = b$ . Entonces el conjunto de soluciones de mínimos cuadrados son todas las tales $x$ tal que $Ax = \mathrm{Proj}_{R(A)} b$ el vector más próximo a $b$ contenida en $R(A)$ . Sin embargo, dado que $A$ (como matriz) es deficiente en cuanto al rango de columna, tiene un núcleo no trivial, y por lo tanto $x$ no es único y puede expresarse mediante $x = x_p + x_n$ donde $x_n \in \ker(A)$ y $x_p \in \ker(A)^{\perp}$ tal que $Ax_p = \mathrm{Proj}_{R(A)} b$ . Entonces $\|x\|^2 = \|x_p\|^2 + \|x_n\|^2$ así que claramente $\|x\|$ se minimiza cuando $x_n = 0$ y $A^{\dagger}$ es precisamente aquella matriz que toma $b$ a $x_p$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X