¿Hay una implementación de bosques al azar que funciona bien con muy escasos datos?

Question

¿Hay una implementación de bosques al azar que funciona bien con muy escasos datos?

Preguntado el 20 de Mayo, 2012: Cuando se hizo la pregunta
2351 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Hay una R al azar bosque aplicación que funciona muy bien con los datos dispersos? Tengo miles o millones de boolean las variables de entrada, pero sólo cientos o lo será CIERTO para cualquier ejemplo.

Soy relativamente nueva a R e notado que hay un 'Matrix' paquete para tratar con datos dispersos, pero el estándar de 'randomForest' paquete no parece reconocer este tipo de datos. Si es importante, los datos de entrada va a ser producido fuera de R e importados.

Algún consejo? También puede considerar el uso de Weka, Mahout u otros paquetes.

Gracias!

Preguntado el 20 de Mayo, 2012 por Tom Leys

Answer 1

2 Respuestas

Answer 2

15voto

ESRogs Puntos 1381

No, no hay ninguna aplicación de RF para los escasos datos en R. parcialmente porque RF no encaja muy bien en este tipo de problema, embolsada y óptima selección de divisiones puede perder la mayor parte de la penetración del modelo en áreas sólo cero.

Probar algún método kernel o mejor pensar en convertir los datos en alguna representación más exuberante con algunos descriptores (o utilizar algún método de reducción de dimensionalidad).

Respondido el 24 de Mayo, 2012 por ESRogs (1381 Puntos )

Answer 3

-4voto

Vincent Puntos 5

Hay un blog llamado Quick-R, que deben ayudar con los conceptos básicos de R.

R funciona con paquetes. Cada paquete se puede hacer algo diferente. No es este paquetes llamados "randomForests" que debería ser justo lo que usted está pidiendo.

Ser conscientes de que los datos dispersos va a dar problemas, independientemente del método que se aplique. A mi entender es un problema abierto y la minería de datos en general, es más un arte que una ciencia. Bosques aleatorios hacer muy bien en general, pero no siempre son el mejor método. Puede que desee probar una red neuronal con un montón de capas, que podría ser de ayuda.

Respondido el 24 de Mayo, 2012 por Vincent (5 Puntos )

¿Hay una implementación de bosques al azar que funciona bien con muy escasos datos?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Hay una implementación de bosques al azar que funciona bien con muy escasos datos?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: