La prueba de este resultado se muestra a menudo en el libro de análisis numérico elemental. Aquí hay un bosquejo.
Primero muestras que existe un punto fijo único para $x = g(x) = Ax + b$ . El punto fijo $x$ satisface $x = g(x)$ si y sólo si $(I-A)x = b$ que te da existencia y unicidad si $I-A$ es invertible. Los valores propios $ \mu $ de $I-T$ satisface $$ \det ((I-T) - \mu I) = 0 \quad \Longleftrightarrow \quad \det (T - (1- \mu ) I) = 0 $$ para que $ \rho (T) = \max_ {i=1}^n | \lambda_i | < 1$ implica $|1- \mu | < 1$ y hemos terminado.
Ahora que tenemos existencia y unicidad, $x_{k+1} = Ax_k + b$ significa $x_{k+1} - x = A(x_k - x)$ . Supongamos en este punto que $A$ es diagonal, de modo que el error puede ser escrito como $$ x_0 - x = \sum_ {i=1}^n \gamma_i v_i $$ lo que significa $$ x_{k+1} - x = A(x_k - x) = \sum_ {i=1}^n \gamma_i \lambda_i ^k v_i $$ por inducción en $k$ . Por lo tanto, desde $| \lambda_i ^k| = | \lambda_i |^k \to 0$ como $k \to \infty $ (porque $| \lambda_i | < 1$ ), sabemos que el "término de error" $x_k - x$ va a $0$ así que tu algoritmo converge.
Debo decir que aunque no tengo pruebas cuando $A$ no es diagonal.
Espero que eso ayude,