$\def\l{|\!|}$ Dada la red elástica de regresión
$$\min_b \frac{1}{2}\l y - Xb \l^2 + \alpha\lambda \l b\l_2^2 + (1 - \alpha) \lambda \l b\l_1$$
¿cómo puede una gama apropiada de $\lambda$ ser elegido para la validación cruzada?
En el $\alpha=1$ de los casos (regresión ridge) la fórmula
$$\textrm{dof} = \sum_j \frac{s_j^2}{s_j^2+\lambda}$$
puede ser utilizado para dar un equivalente a los grados de libertad de cada lambda (donde $s_j$ son los valores singulares de a $X$), los grados de libertad y puede ser elegido en un ámbito sensible.
En el $\alpha=0$ de los casos (el lazo) sabemos que
$$\lambda > \lambda_{\textrm{max}} = \max_j|\sum_t y_t X_{tj}|$$
el resultado es que todas $b_j$ cero, y $\lambda$ puede ser elegido en un rango $(0, \lambda_\textrm{max})$.
Pero, ¿cómo manejar el caso mixto?