1 votos

Efecto de la transformación de variables en el modelo predictivo

Dos preguntas :

  1. ¿Es necesaria la transformación de una distribución sesgada para un problema de clasificación?
  2. Y considere un caso en el que ya he transformado las variables , por lo que la ecuación funcionará para las variables transformadas. Ahora bien, si utilizo este modelo con datos nuevos y nunca vistos en los que las variables no se han transformado, ¿servirá?

1voto

rst Puntos 1
  1. Según mi experiencia, no es necesario, pero transformar variables puede ser muy beneficioso. También depende siempre de la variable. También depende del tipo de modelo que esté utilizando; para la regresión logística es una buena idea y una recomendación sería utilizar el agrupamiento por peso de la evidencia (WOE).

Para otros algoritmos basados en árboles, como Random Forest, no es necesario, ya que el algoritmo realizará los cortes por sí mismo.

  1. La respuesta es No. Por el bien del argumento, digamos que usted ha creado una Regresión Logística, con una variable transformada.

Esa variable transformada es en realidad una variable NUEVA, por lo que una vez que obtengas un nuevo conjunto de datos, deberás aplicar las mismas transformaciones y luego hacer tus predicciones.

Si no he sido claro en alguno de mis puntos, hágamelo saber y estaré encantado de explicarlo :)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X