5 votos

Imputación mediante MICE: utilizar los datos de entrenamiento para imputar los datos de prueba que faltan.

Estoy usando mice en R para imputar valores perdidos. Si he entendido bien, mice especifica un modelo totalmente condicional para extraer nuevos valores de alguna distribución posterior para rellenar los huecos.

Como mis datos están divididos en un conjunto de entrenamiento y otro de prueba, no creo que pueda imputar todo el conjunto de datos, ya que se filtraría información del conjunto de prueba. Sin embargo, parece un derroche volver a empezar todo el procedimiento de imputación, sobre todo porque el conjunto de prueba es más pequeño.

¿Hay alguna forma de reutilizar el modelo aprendido en el conjunto de pruebas?

1voto

Zenu Khas Puntos 1

Creo que deberías imputar en tus datos de entrenamiento y luego almacenar ese modelo para usarlo para predecir en tu conjunto de pruebas. El problema es que no puedes hacer esto con el paquete de ratones. Puede que quieras echar un vistazo a ?caret::preProcess y ?recipes::step_knnimpute o ?recipes::step_bagimpute. Ambos paquetes pueden hacer lo que quieres, pero tienen menos funciones que mice.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X