$w = (X^TX)^{-1}X^Ty$
La ecuación de arriba produce peso $w$ que resuelve cuadrática problema de minimización de funciones lineales.
Desde mi entender, el objetivo es encontrar a $w$ tal forma que:
$Xw ≈ y$
Por lo tanto, tengo que minimizar la función:
$||Xw-y||^2$
De acuerdo a wikipedia, la norma Euclídea se utiliza para minimizar esta función:
$2X^T(Xw - y) = 0$
Luego de esta ecuación se diferencian con respecto de $w$, desde mi entender utilizamos multivariable regla de la cadena:
$X^TXw-X^Ty=0$
$X^TXw=X^Ty$
$w=(X^TX)^{-1}(X^Ty)$
De alguna manera, mediante la utilización de la norma Euclídea, yo minimiza la función, pero soy incapaz de entender cómo funciona exactamente el trabajo.
¿Por qué es la norma Euclídea utilizado para resolver cuadrática de minimización de problemas de funciones lineales?