Estoy teniendo problemas para entender la función de pérdida scikit-learn utiliza para ajustar la regresión logística, que se puede encontrar aquí .
Concretamente tengo problemas con el segundo término. Parece muy diferente del criterio MLE habitual. ¿Puede alguien darme alguna pista de dónde viene esto?
$$\mathop {\min{\mkern 1mu} }\limits_{w,c} \frac{1}{2}{w^T}w + C\sum\limits_{i = 1}^n {\log } (\exp ( - {y_i}(X_i^Tw + c)) + 1)$$
Creo que normalmente la probabilidad logarítmica de una regresión logística es algo parecido a lo siguiente. Claramente el primer término de abajo falta en la función objetivo de scikit-learn.
$$LLH=\sum_{i=1}^n \left[{y_i}(X_i^Tw + c) - \ln\{1+\exp(X_i^Tw + c)\} \right]$$