Estoy escribiendo una rutina para regresión logística con lazo en matlab
. Entonces, el problema es minimizar la función de probabilidad de registro negativa con el término de penalización
$$\sum \left(\log(1 + e^{X_i' \beta}) - y_i X_i' \beta\right) + \lambda \sum |\beta_i|$$
where $ \ beta$ is the model parameter, $ X_i$ is the $ i$th row of matrix $ X$, and $ y_i$ is the value of observation $ i$.
My first question is for a 5-fold cross-validation, which criterion should I use to pick the best value of $ \ lambda $ ? ¿Debo usar el valor de la función logit en el conjunto de datos de validación o la tasa de clasificación errónea en los datos de validación?