Quiero usar la disminución en el coeficiente de Gini de la impureza para clasificar las características de mi bosque aleatorio clasificador. Entiendo que la disminución en el coeficiente de Gini de la impureza en un nodo se calcula como:
$$ \Delta i(n) = i(n) - p_li(n_l) - p_ri(n_r) $$
La disminución global de Gini de la impureza se suman a lo largo de todos los nodos y todos los árboles de un nodo dado ref. No entiendo muy bien si existe un vínculo entre la disminución en el coeficiente de Gini de la impureza y la predicción de rendimiento? Es decir, de Gini impureza dice que características son las más importantes en relación con los demás. Pero puedo deducir cuánto a las características individuales afectará el rendimiento de la predicción, dado el coeficiente de Gini de la impureza? He leído los siguientes puestos de trabajo:
Gini y disminuir el índice de Gini de la impureza de los nodos hijos
¿Cuál es la relación entre el coeficiente de GINI de puntuación y el log-likelihood ratio