Estoy trabajando en un problema de clasificación binaria, con cerca de 1000 binario funciones en total. El problema es que para cada punto de datos, solo sé que los valores de un pequeño subconjunto de las características (alrededor de 10 a 50), y las características de este subgrupo son bastante aleatorios.
Lo que es una buena manera de lidiar con el problema de las funcionalidades que faltan? ¿Existe un algoritmo de clasificación que se encarga de las características que faltan? (Naive Bayes debería funcionar, pero ¿hay algo más?) Supongo que no quiero hacer algún tipo de variable de imputación, ya que tengo tantas características que faltan.