Tengo dos conjuntos de datos
- Datos del tren
- Datos de prueba (sin valores de la variable dependiente pero con I tengo datos de la variable independiente o se puede decir que necesito pronosticar).
Utilizando los datos de entrenamiento (que tienen algunos NA
s en la celda) realicé una regresión por mínimos cuadrados ordinarios (OLS) utilizando lm()
en R y ajusté el modelo y obtuve el $\beta $ coeficientes del modelo de regresión. (¡Todo va bien hasta ahora!)
Ahora, en el proceso de predicción de los valores ajustados, tengo algunos valores perdidos para algunas celdas en el conjunto de datos de prueba. He utilizado la función predict()
de la siguiente manera:
predict(ols, test_data.df, interval= "prediction", na.action=na.pass)
para la celda (o celdas) con NA
se descarta toda la fila al generar la salida ( yhat
). ¿Existe alguna función que pueda generar el yhat
valores (que no sean NA
s) para los datos de la prueba sin descartar ninguna fila con valor perdido en la celda.