Estoy usando R de arranque() función para realizar la regresión de arranque.
Cuando inicio() cambia la resolución mis datos, puede suceder que algunos de los coeficientes que faltan, especialmente en el caso de factor de variables con muchos casos.
¿Cómo lidiar con esta situación, desde el punto de vista teórico?
En mi aplicación tengo sustituto de la falta de coeficientes con NAs, por lo tanto, hacer caso omiso de ellas cuando la construcción de las estadísticas sobre la distribución bootstrap.
Como una alternativa pensé en el uso de 0, pero no va a funcionar como un encogimiento de regularización empujando la distribución a 0?
En otras ocasiones, la función de regresión se bloquea debido a que algunos de los factores variables son despojadas de todos los niveles, pero uno no puede ser un predictor con un solo valor. En este caso estoy totalmente de ignorar los coeficientes de regresión y dar la espalda NAs. Pero no puedo entender si está bien suelta un conjunto de regresión sólo por un predictor de ser inútil. Debo tira el predictor?
En conclusión, me gustaría saber: - ¿Cómo lidiar con la falta de coeficientes, debo usar el NAs o Ceros. - ¿Cómo lidiar con la función de regresión se bloquea a menudo debido a los predictores de la izquierda con un solo nivel? debo tira el predictor?
Gracias