Hay un resultado estándar de la regresión lineal que los coeficientes de regresión son dadas por
$$\mathbf{\beta}=(\mathbf{X^T X})^{-1}\mathbf{X^T y}$$
or
$(\mathbf{X^T X})\mathbf{\beta}=\mathbf{X^T y} \etiqueta{2}\label{eq2}$
El escalado de las variables explicativas no afecta a las predicciones. He tratado de mostrar en este algebraicamente de la siguiente manera.
La respuesta está relacionada con las variables explicativas a través de la ecuación de matriz $\mathbf{y}=\mathbf{X \beta} \tag{3}\label{eq3}$
$\mathbf{X}$ es $n \times (p+1)$ matriz de n observaciones de p variables explicativas. La primera columna de $\mathbf{X}$ es una columna de unos.
El escalado de las variables explicativas, con un $(p+1) \times (p+1) $ matriz diagonal $\mathbf{D}$, cuyas entradas son los factores de escala $ \mathbf{X^s} = \mathbf{XD} \tag{4}\label{eq4}$
$\mathbf{X^s}$ and $\mathbf{\beta^s}$ satisfy $\eqref{eq2}$:
$$(\mathbf{D^TX^T XD})\mathbf{\beta^s} =\mathbf{D^TX^T y}$$
so
$$\mathbf{X^T XD}\mathbf{\beta^s} =\mathbf{X^T y}$$
$$\Rightarrow \mathbf{D \beta^s} = (\mathbf{X^T X)^{-1}}\mathbf{X^T y}=\mathbf{\beta}$$
$\Rightarrow \mathbf{\beta^s}=\mathbf{D}^{-1}\mathbf{\beta} \etiqueta{5}\label{eq5}$
This means if an explanatory variable is scaled by $d_i$ then the regression coefficient $\beta_i$is scaled by $1/d_i$ y el efecto de la escala anula, es decir, teniendo en cuenta las predicciones basadas en la escala de valores, y el uso de $\eqref{eq4},\eqref{eq5},\eqref{eq3}$
$$\mathbf{y^s}=\mathbf{X^s \beta^s} = \mathbf{X D D^{-1}\beta}=\mathbf{X \beta}=\mathbf{y}$$ como era de esperar.
Ahora a la pregunta.
Para la regresión logística sin ningún tipo de regularización, se sugiere, haciendo regresiones con y sin escala el mismo efecto se ve
fit <- glm(vs ~ mpg, data=mtcars,family=binomial)
print(fit)
Coefficients:
(Intercept) mpg
-8.8331 0.4304
mtcars
Cuando la variable mpg es la escala de 10, el coeficiente correspondiente es reducido por 10.
- Cómo podría esta propiedad de escala estar demostrar (o refutar ) algebraicamente para la regresión logística?
He encontrado una pregunta similar, relativas al efecto de las AUC cuando la regularización se utiliza.
- Es allí cualquier punto de escalado de las variables explicativas en la regresión logística, en la ausencia de regularización?
Gracias.