2 votos

Codificación ordinal de características (¿lineal o no lineal?)

En la mayoría de los rasgos ordinales, parece que la escala es lineal. Por ejemplo [1, 2, 3, 4] con una puntuación más alta que representa un mayor efecto sobre las variables objetivo

Pero, ¿es posible codificar la característica de forma no lineal? como por ejemplo [1, 2, 4, 8] . Cuál es el posible impacto en el modelo de aprendizaje automático, como la red neuronal y el bosque aleatorio.

3voto

Vitaly Zdanevich Puntos 95

Dado que la transformación no lineal es invertible, no tendrá un efecto visible para el bosque aleatorio porque los árboles de decisión entrenados internamente encontrarán puntos de división para estas características. Por ejemplo, si con las características originales el mejor punto de división (por ejemplo, en términos de entropía o medida de gini) está entre 2-3, tras la transformación estará entre 2-4.

En el caso de las redes neuronales, la escala de la característica cambia. Esto puede afectar al rendimiento del descenso de gradiente si la escala es demasiado alta. Por ejemplo, la transformación $100^x$ incluso después de la normalización de las características, se crearán puntos de datos que parecerán valores atípicos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X