Estas fórmulas son para diferentes formatos de la matriz rectangular $A$ .
La matriz a (pseudo)invertir debe tener rango completo. (añadido:) Si $A\in I\!\!R^{m\times n}$ es una matriz alta, $m>n$ Entonces, esto significa que $rank(A)=n$ es decir, las columnas tienen que ser linealmente independientes, o $A$ como un mapa lineal tiene que ser inyectivo. Si $A$ es una matriz amplia, $m<n$ entonces las filas de la matriz tienen que ser independientes para dar el rango completo. (/edit)
Si el rango completo es un hecho, entonces es mejor simplificar estas fórmulas utilizando una descomposición QR para $A$ resp. $A^T$ . Allí el factor R es cuadrado y $Q$ es una matriz estrecha y alta con el mismo formato que $A$ o $A^T$ ,
Si $A$ es alto, entonces $A=QR$ y $A^{\oplus}_{left}=R^{-1}Q^T$
Si $A$ es amplia, entonces $A^T=QR$ , $A=R^TQ^T$ y $A^{\oplus}_{right}=QR^{-T}$ .
Sólo necesitas una SVD si $A$ se sospecha que no tiene el rango máximo para su formato. Entonces una estimación fiable del rango sólo es posible comparando las magnitudes de los valores singulares de $A$ . La diferencia es $A^{\oplus}$ que tiene un número muy grande o un cero como valor singular donde $A$ tiene un valor singular muy pequeño.
Añadido, ya que la wikipedia no dice nada al respecto: Numéricamente, primero se calcula o se deja que una biblioteca calcule el SVD $A=U\Sigma V^T$ donde $Σ=diag(σ_1,σ_2,\dots,σ_r)$ es la matriz diagonal de valores singulares, ordenada en tamaño decreciente $σ_1\ge σ_2\ge\dots\ge σ_r$ .
Luego se estima el rango efectivo buscando el menor $k$ con, por ejemplo $σ_{k+1}<10^{-8}σ_1$ o como otra estrategia, $σ_{k+1}<10^{-2}σ_k$ o una combinación de ambos. Los factores que definen lo que es "suficientemente pequeño" son una cuestión de gusto y experiencia.
Con este rango efectivo estimado $k$ se computa $$Σ^⊕=diag(σ_1^{-1},σ_2^{-1},\dots,σ_k^{-1},0,\dots,0)$$ y $$A^⊕=VΣ^⊕U^T.$$
Obsérvese cómo los valores singulares en $Σ^⊕$ y por lo tanto $A^⊕$ son crecientes en esta forma, es decir, el truncamiento en el rango efectivo es una operación muy sensible, las diferencias en esta estimación conducen a resultados muy variables para el pseudoinverso.