En muchas de las aplicaciones que no está con los requisitos de alta, es común el uso de $(A^{\text T}A+\lambda I)^{-1}A^{\text T}$ o $A^{\text T}(AA^{\text T}+\lambda I)^{-1}$ ($\lambda$ es pequeño) para aproximarse a la de Moore-Penrose pseudoinverse $A^{\dagger}$. Pero a partir de las propiedades de Moore-Penrose pseudoinverse, ¿cómo podemos saber que $(A^{\text T}A+\lambda I)^{-1}A^{\text T}$ $A^{\text T}(AA^{\text T}+\lambda I)^{-1}$ va a estar cerca de la solución exacta?
Parece que $$ \lim_{\lambda \rightarrow 0}(A^{\text T}+\lambda I)^{-1}^{\text T} = A^{\daga} $$ Quiero saber por qué sucede esto (Se puede tratar en Matlab para la verificación). Además, también es posible para $A^{\text T}A + \lambda I$ a ser singular. Toda la cosa es que me confunde.
Y la pregunta siguiente es, si queremos restringir el error de $(A^{\text T}A+\lambda I)^{-1}A^{\text T}$, aproximándose a las $A^{\dagger}$ a un cierto punto, podemos saber el límite superior de la $\lambda$ según algunos criterios?