Estoy buscando una explicación de cómo relativa de importancia variable se calcula en Gradiente Impulsado Árboles que no es demasiado general y simplista como:
Las medidas se basan en el número de veces que una variable es seleccionado para la división, ponderado por el cuadrado de la mejora del modelo como resultado de cada división, y promediado sobre todos los árboles. [Elith et al. 2008]
Y que es menos abstracto que:
$\hat{I_{j}^2}(T)=\sum\limits_{t=1}^{J-1} \hat{i_{t}^2} 1(v_{t}=j)$
Donde la suma es sobre el no terminal nodos $t$ de la $J$-terminal de nodo árbol $T$, $v_{t}$ es la distribución de la variable asociada con el nodo $t$, e $\hat{i_{t}^2}$ es el correspondiente empírica mejora en el error cuadrado como resultado de la división, que se define como $i^2(R_{l},R_{r})=\frac{w_{l}w_{r}}{w_{l}+w_{r}}(\bar{y_{l}}-\bar{y_{r}})^2$ donde $\bar{y_{l}}, \bar{y_{r}}$ son la izquierda y la derecha hija de respuesta, respectivamente, y $w_{l}, w_{r}$ son las correspondientes sumas de los pesos. [Friedman 2001]
Finalmente, no he podido encontrar la Hastie a ser muy provechoso leer aquí, como en la sección correspondiente (10.13.1 página 367) gustos muy similares a los de la segunda referencia anteriormente (lo cual puede ser explicado por el hecho de que Friedman es un co-autor del libro).
PS: sé relativa de la variable importancia de las medidas están dadas por el resumen.gbm en el gbm paquete de R. Traté de explorar el código fuente, pero me parece que no puede encontrar en donde el cálculo se lleva a cabo.
Puntos Brownie: me estoy preguntando cómo conseguir estas parcelas en R.