-
Los bosques aleatorios (RF) son un método competitivo de modelado/minado de datos.
-
Un modelo de RF tiene una salida: la variable de salida/predicción.
-
El enfoque ingenuo para modelar múltiples salidas con RFs sería construir una RF para cada variable de salida. Así que tenemos N modelos independientes independientes, y si hay correlación entre las variables de salida tendremos una estructura de modelo redundante/duplicada. Esto podría ser muy desperdicio. Además, como regla general, un mayor número de variables del modelo implica un modelo más sobreajustado (menos generalización). No estoy seguro de que esto se aplique aquí, pero probablemente sí.
En principio podríamos tener una RF con múltiples salidas. La variable de predicción es ahora un vector (n-tupla). Los nodos de decisión de cada árbol de decisión dividen ahora el conjunto de vectores objetivo/predicción basado en un vector umbral, me imagino que este umbral se toma como un plano en el espacio n-dimensional y que por lo tanto podemos determinar en qué lado del vector umbral se encuentra cada uno de los vectores objetivo.
El valor de predicción óptimo para cada lado de la división de la decisión es la media (centroide) calculada para los vectores de cada lado.
Encontrar el punto de división óptimo cuando se trabaja con variables únicas es trivial y computacionalmente rápido/eficiente. Para una n-tupla no podemos encontrar la división óptima (o al menos se vuelve inviable computacionalmente computacionalmente inviable a medida que aumenta N), pero podemos encontrar una división casi óptima utilizando un método de tipo Monte Carlo (o algún híbrido de Monte Carlo y el gradiente local).
¿Funcionaría esto realmente? Es decir, ¿sólo mapearía los pares de entrenamiento sin generalizar? ¿Existe ya esta técnica con otro nombre?
También podría considerar cómo se relaciona esto con las redes neuronales, como las máquinas de Boltzmann restringidas (RBM) y las redes de creencia profunda.
0 votos
Buscando en Google "bosque aleatorio multietiqueta" se ve que esto se ha hecho incluso de varias formas distintas; de todos modos, he estado jugando con este enfoque de muchos binarios-rfs en la recuperación de información musical y lo hacía bastante bien.
1 votos
Le sugiero que este artículo . Hacen algo muy parecido a lo que has descrito.
2 votos
Esto ya existe en el paquete party y en algunos otros paquetes (lenguaje R).