Tengo una tarea (curso de minería de datos) y hay una parte que pregunta: "¿Cuáles son las desventajas de usar la media para los valores perdidos?" en la sección Missing Value
Entonces busqué un poco y la respuesta más común fue: "Porque reduce la varianza".
¿Por qué se considera mala esta reducción de la varianza? ¿Y hay alguna otra desventaja además de la reducción de la varianza?