Hay una R al azar bosque aplicación que funciona muy bien con los datos dispersos? Tengo miles o millones de boolean las variables de entrada, pero sólo cientos o lo será CIERTO para cualquier ejemplo.
Soy relativamente nueva a R e notado que hay un 'Matrix' paquete para tratar con datos dispersos, pero el estándar de 'randomForest' paquete no parece reconocer este tipo de datos. Si es importante, los datos de entrada va a ser producido fuera de R e importados.
Algún consejo? También puede considerar el uso de Weka, Mahout u otros paquetes.
Gracias!