Me doy cuenta de que los árboles de decisión son los métodos no paramétricos
Lo que debe residual vs real/equipada para un bien comportado de árbol de regresión?
Mi argumento sería que, dado que cada observación asignado a un nodo terminal se le asigna (como un valor de predicción) de la media de la variable dependiente en la terminal de nodo, es de esperar que la distribución condicional (es decir, para cada nodo) será de aproximadamente normal.
- He adjuntado dos parcelas de mi árbol de decisión (valida en un 63% en el conjunto de pruebas, así que tipo de débil), residuos vs equipada y residuos vs real -Básicamente, mi pregunta: ¿no sería una fuerte regresión árbol parece un paso-la función de la clase?
Respuesta
¿Demasiados anuncios?La predicción se verá como una función de paso, pero no el de las parcelas se incluyen.
El residual vs real la trama se ve bien para mí. He visto las parcelas que incluso en regresión. En la regresión, la diagonal patrones ventana emergente cuando se tienen muchas observaciones con el mismo $X$s. Llevar a un grupo que tiene la misma predicción y el índice de con $i$. La idea es que si el $X$s son los mismos, entonces la trama se $\hat{y}_{i} - y_{i} = r_{i}$ pero $\hat{y}_{i}=p$, por lo que en el avión con $(y,r)$ ejes se ve como una línea diagonal recta. En el árbol de regresión tiene muchos grupos donde la predicción es idéntico, por lo que el patrón debe venir.
La segunda trama tiene un aspecto extraño. Es que el argumento para el tren o el conjunto de pruebas? Si es el tren, es de todo punto visible? En el tren me sería de esperar que los residuos de estar centrado en 0, suponiendo que se construyó el árbol de minimizar la varianza inexplicada y que cada observación tiene el mismo peso.