Hola compañero científico de datos,
Actualmente estoy leyendo el artículo de Stekhoven & Brühlmann sobre MissForest. Me preguntaba cómo tratar las variables que están restringidas por el conocimiento del dominio. Por ejemplo, ninguna mujer puede no haber tenido cáncer de próstata en el pasado, por lo que se buscan valores perdidos para este elemento. ¿Debería excluir dichas variables (si se desean/introducen valores perdidos) de la imputación de MissForest?
Si es así, ¿cómo puedo combinar estas variables con los conjuntos de datos imputados después?
Espero que esto sea lo suficientemente específico. Gracias de antemano