1 votos

R Paso del modelo lineal Valores NA

Mi objetivo es realizar un modelo lineal generalizado (glm) con 1 variable de respuesta y 13 variables explicativas.Desafortunadamente 3 de las 10 variables explicativas contienen valores NA (2/3 del conjunto de datos de estas 3 variables son valores NA - en total 410 observaciones). Me di cuenta de que la función "step" no funciona con valores NA (¿Por qué cambia el número de filas durante el AIC en R? ¿Cómo garantizar que esto no ocurra?). Por eso mi pregunta: ¿Cómo puedo proceder para mejorar automáticamente mi glm sin eliminar mis sitios con valores NA?

Ejemplo (sólo 3 variables explicativas y 5 observaciones) enter image description here

1voto

Dario Castañé Puntos 131

Ya veo. Gracias por la aclaración. Creo que deberías considerar o conoces la imputación múltiple. Se trata de una técnica que podría considerar aquí y que le permite "rellenar" los valores que faltan en su conjunto de datos con conjeturas estadísticamente razonables. La mayoría de los paquetes de software estadístico tienen rutinas que realizan la imputación por usted. Una vez que se han imputado los datos, se pueden ejecutar los análisis en los múltiples conjuntos de datos creados por la rutina y los resultados se promedian sobre los datos imputados. ¿Qué software está utilizando?

Una cosa que hay que tener en cuenta es que, por lo general, no es una buena idea imputar los datos cuando hay grandes proporciones de datos perdidos. ¿Qué porcentaje de cada una de sus variables falta? ¿Hay alguna forma de investigar o hacer un seguimiento de sus centros para determinar los valores que faltan realmente?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X