A menos que la forma cerrada de la solución es extremadamente caro para calcular, por lo general, es el camino a seguir cuando está disponible. Sin embargo,
Para la mayoría de regresión no lineal de los problemas no es la forma cerrada de la solución.
Incluso en la regresión lineal (uno de los pocos casos en los cuales la forma cerrada de la solución está disponible), puede ser poco práctico para el uso de la fórmula. El siguiente ejemplo muestra una forma en que esto puede suceder.
Para la regresión lineal sobre un modelo de la forma $y=X\beta$ donde $X$ es una matriz con una columna completa en la clasificación, la solución de mínimos cuadrados,
$\hat{\beta} = \arg \min \| X \beta -y \|_{2}$
está dada por
$\hat{\beta}=(X^{T}X)^{-1}X^{T}y$
Ahora, imagina que $X$ es muy grande pero la matriz dispersa. por ejemplo, $X$ podría tener de 100.000 columnas y 1.000.000 de filas, pero sólo el 0,001% de las entradas en $X$ son cero. Hay especializados estructuras de datos para almacenar sólo el cero entradas de tales matrices dispersas.
También imagino que estamos de mala suerte, y $X^{T}X$ es bastante una matriz densa con un porcentaje mucho mayor de cero entradas. Almacenamiento de una densa por 100,000 100,000 elemento $X^{T}X$ matriz sería necesario, entonces, $1 \times 10^{10}$ números de punto flotante (en 8 bytes por número, esto viene a 80 gigabytes.) Esto sería poco práctico para almacenar en nada, pero de un superordenador. Además, la inversa de esta matriz (o más comúnmente un factor de Cholesky) también tienden a tener principalmente distinto de cero entradas.
Sin embargo, hay métodos iterativos para la solución de los mínimos cuadrados problema que no requieren más espacio de almacenamiento que $X$, $y$, y $\hat{\beta}$ y nunca explícitamente forman la matriz producto $X^{T}X$.
En esta situación, el uso de un método iterativo es mucho más eficiente computacionalmente que el uso de la forma cerrada de la solución del problema de mínimos cuadrados.
Este ejemplo puede parecer absurdamente grande. Sin embargo, disperso grande de mínimos cuadrados de los problemas de este tamaño son rutinariamente resuelto por métodos iterativos en los equipos de escritorio en la tomografía sísmica de investigación.