2 votos

Árboles de decisión: Parámetro de complejidad de costo y $-\infty$

Estoy leyendo el libro titulado "An Introduction to Statistical Learning with Applications in R" de James et al. En la página 326, realizamos la validación cruzada para determinar el nivel óptimo de complejidad del árbol (para un árbol de clasificación). Aquí puedes encontrar un extracto del código R proporcionado. Como puedes notar, uno de los valores de $k$ (que en realidad es el parámetro de ajuste $\alpha$ para la poda de complejidad de costo) es igual a $-\infty$. Me preguntaba, ¿cómo se puede obtener $-\infty$ para el parámetro de complejidad de costo?

Gracias de antemano.

3voto

usεr11852 Puntos 5514

El valor -Inf en realidad no se relaciona con la funcionalidad de cv.tree sino más bien con la funcionalidad alrededor de prune.tree/prune.misclass. Dentro de esas funciones examinamos una serie de diferentes parámetros de complejidad $k$. Estos parámetros de complejidad $k$ cuando comienzan su "búsqueda en rejilla" se establecen en algo ridículamente negativo (pequeño) para asegurarnos de que no penalizamos nada y tenemos el árbol máximo posible. El número real es realmente algo como -1.0e+200. Luego, de una manera bastante burda dentro de prune.tree, el primer miembro de la secuencia de $k$'s se establece en menos infinito (literalmente: k[1L] <- -Inf).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X