MissForest para SurveyData

Question

MissForest para SurveyData

Preguntado el 12 de Junio, 2019: Cuando se hizo la pregunta
81 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Hola compañero científico de datos,

Actualmente estoy leyendo el artículo de Stekhoven & Brühlmann sobre MissForest. Me preguntaba cómo tratar las variables que están restringidas por el conocimiento del dominio. Por ejemplo, ninguna mujer puede no haber tenido cáncer de próstata en el pasado, por lo que se buscan valores perdidos para este elemento. ¿Debería excluir dichas variables (si se desean/introducen valores perdidos) de la imputación de MissForest?

Si es así, ¿cómo puedo combinar estas variables con los conjuntos de datos imputados después?

Espero que esto sea lo suficientemente específico. Gracias de antemano

Preguntado el 12 de Junio, 2019 por PythonBeginner

Answer 1

1 Respuestas

Answer 2

0voto

Bill Puntos 16

Por lo general, es mejor aplicar primero reglas lógicas para rellenar algunos espacios en blanco, seguidas eventualmente de una imputación algorítmica.

Tomemos, por ejemplo, un conjunto de datos sobre las características de las casas. Una de las columnas es "piscina", con un 1 (sí) o un 0 (no). La imputación algorítmica establecería todos los faltantes en "1", destruyendo toda la información sobre tener o no una piscina.

Respondido el 12 de Junio, 2019 por Bill (16 Puntos )

MissForest para SurveyData

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

MissForest para SurveyData

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: