¿Cuál es el rango típico de valores posibles para el parámetro de contracción en la regresión penalizada?

Question

¿Cuál es el rango típico de valores posibles para el parámetro de contracción en la regresión penalizada?

Preguntado el 15 de Agosto, 2014: Cuando se hizo la pregunta
13337 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

En la regresión lasso o ridge, hay que especificar un parámetro de contracción, a menudo denominado por $\lambda$ o $\alpha$ . Este valor suele elegirse mediante validación cruzada, comprobando un grupo de valores diferentes en los datos de entrenamiento y viendo cuál da el mejor resultado, por ejemplo. $R^2$ en los datos de las pruebas. ¿Cuál es el intervalo de valores que se debe comprobar? ¿Es $(0,1)$ ?

Preguntado el 15 de Agosto, 2014 por DragonLord

Answer 1

2 Respuestas

Answer 2

5voto

OpenAndroid Puntos 116

No hace falta que te molestes. En la mayoría de los paquetes (como glmnet) si no especifica $\lambda$ , el paquete de software genera su propia secuencia (lo que suele recomendarse). La razón por la que subrayo esta respuesta es que durante la ejecución del LASSO el solucionador genera una secuencia de $\lambda$ por lo que, aunque pueda resultar contraintuitivo proporcionar un único $\lambda$ puede ralentizar considerablemente el solucionador (cuando se proporciona un parámetro exacto, el solucionador recurre a la resolución de un programa semidefinido que puede ser lento para casos razonablemente "sencillos").

En cuanto al valor exacto de $\lambda$ potencialmente puede elegir lo que quiera de $[0,\infty[$ . Tenga en cuenta que si su $\lambda$ es demasiado grande, la penalización será demasiado grande y, por tanto, ninguno de los coeficientes podrá ser distinto de cero. Si la penalización es demasiado pequeña, el modelo se ajustará en exceso y no será la mejor solución de validación cruzada.

Respondido el 15 de Agosto, 2014 por OpenAndroid (116 Puntos )

Answer 3

1voto

Tristan Charpentier Puntos 23

Para aquellos que tratan de entender esto:

He descubierto que hay una gran diferencia entre permitir glmnet para calcular $\lambda$ y para cuando creamos un rango para que elija ( grid ).

He aquí un ejemplo utilizando "solicitantes" en el campo College conjunto de datos de ISLR

# Don't forget to set seed
set.seed(1)
train <- sample(1:dim(College)[1], 0.75*dim(College[1]))

# Matrices
xmat.train <- model.matrix(Apps~.-1,data=College[train,])
xmat.test <- model.matrix(Apps~.-1, data= College[-train,])

y <- College$Apps[train]

# Create a grid of values for the scope of lambda (optional):
grid <- 10 ^ seq(10,-2,length = 100)

# Add the grid here as lambda (optional)
ridge.fit <- glmnet(xmat.train, y, alpha = 0, lambda=grid)
cv.ridge <- cv.glmnet(xmat.train, y, alpha =0, lambda=grid)

bestlam <- cv.ridge$lambda.min
cat("\nBestlam (with grid):",bestlam)

pred <- predict(ridge.fit, s = bestlam, newx= xmat.test)
cat("\nWith Grid:", mean((College$Apps[-train]-pred)^2))

# Again but without the grid (allowing R to figure lambda out
ridge.fit <- glmnet(xmat.train, y, alpha = 0)
cv.ridge <- cv.glmnet(xmat.train, y, alpha =0)

bestlam <- cv.ridge$lambda.min
cat("\n\nBestlam (no grid):",bestlam)

pred <- predict(ridge.fit, s = bestlam, newx= xmat.test)
cat("\nWithout Grid:", mean((College$Apps[-train]-pred)^2))

Puede ejecutar esto usted mismo, y puede cambiar grid en consecuencia también, he visto ejemplos que van desde grid <- 10 ^ seq(10,-2,length = 100) a grid <- 10^seq(3, -2, by = -.1) .

Mi mejor suposición es que $\lambda$ puede restringirse a ciertos valores, y depende de nosotros averiguar el rango más óptimo.

También me ha resultado muy útil esta guía -> https://drsimonj.svbtle.com/ridge-regression-with-glmnet

Respondido el 28 de Julio, 2020 por Tristan Charpentier (23 Puntos )

¿Cuál es el rango típico de valores posibles para el parámetro de contracción en la regresión penalizada?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cuál es el rango típico de valores posibles para el parámetro de contracción en la regresión penalizada?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: