Dejemos que $x_0, x_1, x_2, \ldots, x_n$ sean nuestras características, y dejemos que $y$ sea la variable objetivo.
Con la regresión lineal, nuestra hipótesis es: $$h_{\theta}(x) = \sum_{i=0}^{n} \theta_{i} x_{i}$$ donde $x_0 = 1$ .
Ahora, con la regresión logística, la hipótesis es: $$h_{\theta}(x) = \frac{1}{1 + e^{-\theta^{T}x}}$$ Tengo algunas preguntas:
-
¿Simplemente utilizamos la hipótesis de la regresión lineal, la introducimos en la función sigmoidea y esa es nuestra nueva hipótesis para la regresión logística? ¿Así que seguimos asumiendo que el resultado es una combinación lineal de las características (antes de sustituirla por la función sigmoidea)?
-
¿Dónde entra la probabilidad? He visto que $$P(y = 1 | x; \theta) = h_{\theta}(x)$$ ¿De dónde viene esto? Por supuesto, es plausible ya que estamos en el rango $[0,1]$ pero no entiendo cómo esta función sigmoidea produce la probabilidad de que la variable objetivo pertenezca a la clase 1.
3 votos
Una pista: $E(y)=Prob(y=1)$ para cualquier variable aleatoria binaria $y$ .