Para modelizar los datos a partir de la ecuación exponencial
$$ y=Ae^{Bx} $$
En el sitio web https://mathworld.wolfram.com/LeastSquaresFittingExponential.html
En la ecuación (5)
$$ \sum_{i=1}^{n}{y_i\left(\ln{\left(y_i\right)}-a-{bx}_i\right)^2} \space\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space \space\space\space\space\space\space\space\space\space\space\space (5) $$
donde
$$ \ln{\left(A\right)}=a $$
$$ B=b $$
Dice que esta suma debe reducirse al mínimo. Funciona mejor que la linealización de los datos y hacer la regresión lineal para la ecuación a continuación.
$$ \ln(y)=\ln(A)+Bx $$
Sé que esto funciona mejor, pero ¿cuál es la justificación para el uso de la ecuación (5) o cómo se derivó?