¿Existe software disponible (o incluso solo documentos relevantes) que pueda realizar aprendizaje multiclase en conjuntos de datos de más de 200 millones de muestras con más de 50 clases y más de 1000 características?
¿Cuáles son los límites en tamaños de conjunto de datos para redes neuronales? ¿Ensamble de árboles de decisiones? SVM?
Como ejemplo: Microsoft ha desarrollado un código que puede construir árboles de decisiones en un clúster de 1 kilonodo de 600 millones de muestras por árbol sobre 32 clases con 2000 características. Se tarda un día en entrenar 3 árboles.
¿Existen programas de acceso público que puedan hacer esto para CUALQUIERA de los algoritmos de aprendizaje anteriores?