¿Cuál es el argumento básico sobre el cual ridge y el lazo de regresión se basa en? Me fui a través de la regularización de Tikhonov wiki en el que se menciona que
En muchos casos, tikhonov de la matriz es la matriz de identidad , dar preferencia a las soluciones con menor normas. En otros casos, filtro de paso bajo de los operadores (por ejemplo, una diferencia de operador o de un promedio ponderado de Fourier el operador) puede ser usado para imponer la suavidad si el subyacente vector se cree para ser casi continuo.
Quiero entender que por qué son soluciones con menor normas más atractivo? La suavidad puedo conseguir, pero ¿por qué más pequeñas normas?