Si tiene sentido o no imputar el año de nacimiento y cómo hacerlo implica una serie de consideraciones.
En primer lugar, la imputación probablemente sólo sea razonable si el patrón de falta es completamente aleatorio (MCAR) o falta al azar (MAR). En la sección 25.1 de este documento . Pregúntese con qué tipo de falta se encuentra probablemente. Si cree que hay un mecanismo para la falta que observa, puede que quiera reconsiderar la imputación.
Otra pregunta es si considera el año de nacimiento como una variable categórica o continua. Si cree que debe tratarse de forma continua, puede hacer uso de varios métodos de imputación. La imputación múltiple puede ser uno de los más adecuados. Se ofrece una vista de pájaro aquí .
Si cree que el año de nacimiento debe tratarse de forma categórica, se enfrenta al reto de imputar una variable categórica. Esto se trata en este documento en el que se analizan las ventajas de una serie de procedimientos de imputación para variables categóricas y se ofrecen algunos ejemplos.
La imputación múltiple para las variables continuas y categóricas puede realizarse con la función mi paquete en R.
Así que, para resumir, se puede imputar el año de nacimiento tanto si se quiere tratar de forma continua como categórica. Sin embargo, primero piense si hay una razón por la que esas observaciones pueden faltar. ¿Cree que son MCAR o MAR, o puede imaginar que hay una razón sistémica para que falten? Si es así, ¿es La falta de respuesta que depende de predictores no observados ? Si es así, ¿puede modelar la falta de datos de alguna manera y evitar que esto le sesgue la imputación? ¿Se trata de Falta que depende del propio valor que falta ? En cualquiera de las dos últimas situaciones, es posible que quiera pensar detenidamente en cómo proceder con su análisis y qué conclusiones puede sacar razonablemente de él.