Tengo la tarea de implementar un azar del árbol de la clasificador en MATLAB.
La lección dice:
Input: observations and lables
While stopping criterion not reached:
1. Node optimization: - several split candidates are randomly generated
- the best splitting function is chosen according to some quality measure
2. Data splitting: observations are pushed to the left or right branch.
3. Move to next node
Stopping criteria:
Quality measure - Number of data points in the current node/leaf
Mi problema ahora es que no entiendo cómo obtener el generado aleatoriamente divididos candidatos? Obtener de los valores de entrada? Pero, a continuación, me gustaría obtener un árbol de decisión (se selecciona un elemento aleatorio y decir >x a la derecha del nodo, < x a la izquierda del nodo.) También no entiendo cuál es la diferencia entre el azar árbol y el árbol de decisión está en la final.
También la conferencia dice:
Choosing the best candidates: according to a quality measures
Out-of-bag error (OOB) - Minimize error rate after splitting using a test set
Information gain - Maximize information gain after splitting
Pero, ¿qué conjunto de pruebas debo usar? El conjunto de pruebas que ya están en el árbol utilizado para el entrenamiento?
Wikipedia y Google no me ayuda. El código de la punta de MATLAB se puede encontrar aquí: http://pastebin.com/iuzqF8gG
Le agradezco su ayuda.