6 votos

Regresión Ridge para minimizar el RMSE en lugar del MSE

Publicado en mi pregunta idéntica en math.stackexchange :

Dada una matriz $X$ y un vector $\vec{y}$ La regresión por mínimos cuadrados ordinarios (MCO) trata de encontrar $\vec{c}$ tal que $\left\| X \vec{c} - \vec{y} \right\|_2^2$ es mínima. (Si suponemos que $\left\| \vec{v}\right\|_2^2=\vec{v} \cdot \vec{v}$ .)

La regresión Ridge intenta encontrar $\vec{c}$ tal que $\left\| X \vec{c} - \vec{y} \right\|_2^2 + \left\| \Gamma \vec{c} \right\|_2^2 $ es mínima.

Sin embargo, tengo una aplicación en la que necesito minimizar no la suma de errores al cuadrado, sino la raíz cuadrada de esta suma. Naturalmente, la raíz cuadrada es una función creciente, por lo que este mínimo estará en el mismo lugar, por lo que la regresión OLS seguirá dando el mismo resultado. Pero, ¿lo hará la regresión ridge?

Por un lado, no veo cómo minimizar $\left\| X \vec{c} - \vec{y} \right\|_2^2 + \left\| \Gamma \vec{c} \right\|_2^2 $ resultará necesariamente en la misma $\vec{c}$ como minimizar $\sqrt{ \left\| X \vec{c} - \vec{y} \right\|_2^2 } + \left\| \Gamma \vec{c} \right\|_2^2 $ .

Por otra parte, he leído (aunque nunca he visto demostrado) que minimizar $\left\| X \vec{c} - \vec{y} \right\|_2^2 + \left\| \Gamma \vec{c} \right\|_2^2 $ (regresión de cresta) es idéntica a minimizar $\left\| X \vec{c} - \vec{y} \right\|_2^2$ con la condición de que $ \left\|\Gamma \vec{c}\right\|_2^2 < t$ donde $t$ es algún parámetro. Y si este es el caso, entonces debería dar como resultado la misma solución que minimizar $\sqrt{ \left\| X \vec{c} - \vec{y} \right\|_2^2}$ con la misma restricción.

0 votos

@RichardHardy ¿Pero cómo puede ser eso? Seguramente, el mínimo de $f(c)$ se producirá con los mismos valores de $c$ como el mínimo de $\sqrt{f(c)}$ considerando $\sqrt{x}$ es una función creciente. (Suponiendo $f(c)$ es positiva por lo que la raíz cuadrada es real. De lo contrario, "mínimo" puede no estar bien definido).

0 votos

Lo siento, me equivoqué en el último punto. El correspondiente $t$ s no estarán relacionados como $t_0$ y $\sqrt{t_0}$ la relación será diferente. Borrado mi comentario.

1 votos

Tenga en cuenta que nuestro centro de ayuda dice: "Tenga en cuenta, no obstante, que no se fomenta la publicación cruzada en los sitios SE. Elija el mejor sitio para publicar su pregunta. Más adelante, si resulta más adecuada en otro sitio, podrá migrarla".

4voto

user164061 Puntos 281

Minimizar

$$ \left\| X \vec{c} - \vec{y} \right\|_2^2 + \left\| \Gamma \vec{c} \right\|_2^2 $$

y minimizar

$$ \sqrt{\left\| X \vec{c} - \vec{y} \right\|_2^2} + \left\| \Gamma \vec{c} \right\|_2^2 $$

no directamente se refieren a minimizar ${\left\| X \vec{c} - \vec{y} \right\|_2^2}$ o $\sqrt{\left\| X \vec{c} - \vec{y} \right\|_2^2}$ bajo la restricción $\left\|\vec{c}\right\|_2^2 < t$ .

Será necesaria una conversión entre $t$ y $\Gamma$ que será diferente para las dos funciones de costes diferentes. Así pues, la minimización de MSE y RMSE con un mismo término de penalización definido por $\Gamma$ se relacionará con una minimización restringida con diferente limitaciones $t$ .

Obsérvese que para cada solución $\vec{c}$ para minimizar el MSE con el término de penalización $\Gamma_1$ habrá un plazo de penalización $\Gamma_2$ que da como resultado la misma solución $\vec{c}$ al minimizar el RMSE penalizado. Así que para muchos fines prácticos se puede utilizar cualquier método/software que resuelva el problema del RMSE penalizado, pero sólo es necesario utilizar una función de coste diferente cuando, por ejemplo, se realiza una validación cruzada para seleccionar el ideal $\Gamma$ .

0 votos

¿Qué quiere decir con lo de "no relacionar directamente"? ¿Debo entender que la regresión de cresta (penalizando $\left\| \Gamma \vec{c} \right\|_2^2 $ ) no es equivalente a resolver la regresión MCO con la restricción de que $\left\|\vec{c}\right\|_2^2 < t$ para algunos valor de $t$ ? Eso parece no concordar con lo que leo en otros sitios (por ejemplo. math.stackexchange.com/questions/335306/ ). Aunque admito de buen grado que en realidad no sigo las derivaciones, por lo que puedo estar malinterpretando sus implicaciones.

0 votos

@acdr Quise decir que no directamente tienen $t=\Gamma$ pero en su lugar se necesita alguna función (que creo que no existe en forma cerrada) para indirectamente relacionar $\Gamma$ y $t$ . Esta función será diferente para los dos casos. Así es como las soluciones de los dos casos pueden ser iguales para el mismo $t$ en la formulación restringida pero diferente para el mismo $\Gamma$ en la formulación penalizada.

2 votos

Ah, creo que lo entiendo. Minimizar el MSE regularizado es equivalente a minimizar el MSE NO regularizado bajo alguna restricción. Pero minimizar el RMSE regularizado es equivalente a minimizar el MSE no regularizado. con una restricción diferente por lo que la solución será diferente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X