Recientemente comencé a estudiar aprendizaje automático, sin embargo no logré entender la intuición detrás de regresión logística.
Lo que entiendo sobre regresión logística es lo siguiente.
-
Como base para la hipótesis usamos función sigmoide. Entiendo por qué es una buena elección, sin embargo no entiendo por qué es la única elección. La hipótesis representa la probabilidad de que la salida apropiada sea $1$, por lo tanto el dominio de nuestra función debe ser $[0,1]$, esta es la única propiedad de la función sigmoide que encuentro útil y apropiada aquí, sin embargo muchas funciones satisfacen esta propiedad. Además, la función sigmoide tiene una derivada en esta forma $f(x)(1-f(x))$, pero no veo la utilidad de esta forma especial en la regresión logística.
Pregunta: ¿qué tiene de especial la función sigmoide y por qué no podemos usar cualquier otra función con dominio $[0,1]$?
-
La función de coste consta de dos parámetros ${\rm Cost}(h_{\theta}(x),y)=-\log(h_{\theta}(x))$ si $y=1, {\rm Cost}(h_{\theta}(x),y)=-\log(1-h_{\theta}(x))$ si $y=0$. De la misma manera que arriba, entiendo por qué es correcto, sin embargo ¿por qué es la única forma? Por ejemplo, ¿por qué no podría $|h_{\theta(x)}-y|$ ser una buena elección para la función de coste?
Pregunta: ¿qué tiene de especial la forma anterior de la función de coste; por qué no podemos usar otra forma?
Agradecería si pudieras compartir tu entendimiento de la regresión logística.
5 votos
La función logística no es la única función que se puede utilizar como una función de enlace para modelos de regresión cuando la respuesta se distribuye como una binomial. En este sentido, puede ayudarte leer mi respuesta aquí: difference-between-logit-and-probit-models.
4 votos
Mi respuesta aquí: es la función logit siempre la mejor para modelar datos binarios con regresión, también puede ser útil para pensar en diferentes posibilidades.
1 votos
@AdamO proporciona un excelente resumen a continuación. Si deseas obtener información más detallada sobre lo que significa que el logit es la 'función de enlace canónica', es posible que desees leer la respuesta de Momo aquí: diferencia-entre-funcion-de-enlace-y-funcion-de-enlace-canonica-para-glm.
1 votos
Un ejemplo ilustrado de trabajo de (1) donde no se utiliza una "sigmoid" se muestra en stats.stackexchange.com/a/70922. Esa respuesta incluye una explicación de (2). Otro ejemplo se muestra en stats.stackexchange.com/questions/63978/.... Una discusión más mundana (pero menos técnica) ocurre en stats.stackexchange.com/a/69873, centrándose en el tema (2).