Quiero saber por qué la regresión logística se llama un modelo lineal. Utiliza una función sigmoidea, que no es lineal. ¿Por qué es regresión logística un modelo lineal?
Respuestas
¿Demasiados anuncios?El modelo de regresión logística es de la forma
$$
\mathrm{logit}(p_i) = \mathrm{ln}\left(\frac{p_i}{1-p_i}\right) = \beta_0 + \beta_1 x_{1,i} + \beta_2 x_{2} + \cdots + \beta_p x_{p,i}.
$$
Se llama generalizada modelo lineal no porque la estimación de la probabilidad de que el evento de respuesta es lineal, sino porque el logit de la probabilidad estimada de respuesta es una función lineal de los predictores de los parámetros.
De manera más general, el Modelo Lineal Generalizado es de la forma $$ \mathrm{g}(\mu_i) = \beta_0 + \beta_1 x_{1,i} + \beta_2 x_{2} + \cdots + \beta_p x_{p,i}, $$ donde $\mu$ es el valor esperado de la respuesta dada las covariables.
Edit: Gracias whuber para la corrección.
Regresión logística utiliza la ecuación linear general $Y=b_0+∑(b_i X_i)+\epsilon$. En regresión lineal $Y$ es una variable dependiente continua, pero en la regresión logística es regresión para la probabilidad de un resultado categórico (por ejemplo 0 y 1).
Es la probabilidad de $Y=1$: $$ P(Y=1) = {1 \over 1+e^{-(b_0+\sum{(b_iX_i)})}} $$