Necesito ayuda con CÓMO Los componentes principales se pueden utilizar como variables regulares en la regresión lineal y logística en R.
Estoy analizando un conjunto de datos que tiene 10 variables (incluida la variable de resultado). Originalmente, estaba prediciendo la variable de resultado utilizando diferentes algoritmos, pero la precisión no era lo suficientemente buena, así que ejecuté un PCA. Este es mi código para el PCA:
dummies <- dummyVars(" ~ .", data = trainset)
trainset_1 <- predict(dummies, newdata = trainset)
fit <- princomp(trainset_1, scores = TRUE, cor = T)
summary(fit)
No sé cómo utilizar los componentes principales para predecir mi resultado en R Studio. Mi código original para la regresión logística multinomial antes del PCA para predecir era:
library(nnet)
REGmodel <- multinom(Outcome ~ ., data = trainset)
summary(REGmodel)
¿Cómo puedo modificar el código anterior para utilizar las variables del análisis de componentes principales para predecir mi resultado (que tiene 2 niveles) en R Studio?