37 votos

¿Cómo estimar el parámetro de contracción en Lasso o regresión de cresta con> 50K variables?

Quiero utilizar la regresión de Lasso o cresta para un modelo con más de 50.000 variables. Quiero hacerlo usando el paquete de software en R. ¿Cómo puedo estimar el parámetro de contracción ($\lambda$)?

Ediciones:

Este es el punto al que llegué:

 set.seed (123)
Y <- runif (1000)
Xv <- sample(c(1,0), size= 1000*1000,  replace = T)
X <- matrix(Xv, nrow = 1000, ncol = 1000)

mydf <- data.frame(Y, X)

require(MASS)
lm.ridge(Y ~ ., mydf)

plot(lm.ridge(Y ~ ., mydf,
              lambda = seq(0,0.1,0.001)))

ingrese la descripción de la imagen aquí

Mi pregunta es: ¿Cómo sé qué$\lambda$ es mejor para mi modelo?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X