Mi objetivo es realizar un modelo lineal generalizado (glm) con 1 variable de respuesta y 13 variables explicativas.Desafortunadamente 3 de las 10 variables explicativas contienen valores NA (2/3 del conjunto de datos de estas 3 variables son valores NA - en total 410 observaciones). Me di cuenta de que la función "step" no funciona con valores NA (¿Por qué cambia el número de filas durante el AIC en R? ¿Cómo garantizar que esto no ocurra?). Por eso mi pregunta: ¿Cómo puedo proceder para mejorar automáticamente mi glm sin eliminar mis sitios con valores NA?
Ejemplo (sólo 3 variables explicativas y 5 observaciones)