2 votos

¿Debe aplicarse la misma estrategia de escalado tanto a la clase objetivo como a los rasgos explicativos?

Estoy trabajando con un conjunto de datos donde la variable dependiente es continua (precio de venta de las casas) y hay un par de docenas de características que estoy utilizando para predecir el precio de venta utilizando un modelo de regresión lineal. Estas características incluyen variables binarias ficticias, categóricas y continuas, todas ellas en diferentes escalas.

La variable dependiente (precio de venta) está sesgada, así que en su lugar he creado una nueva función que es log(salePrice) para que la distribución esté centrada. Mi pregunta es, yo había planeado usar SckiKit-Learn's StadardScaler clase sobre las características explicativas. ¿Tiene sentido utilizar dos técnicas de preprocesamiento diferentes, o debería utilizar simplemente el log de todas las características explicativas como hago con la variable dependiente?

3voto

kjetil b halvorsen Puntos 7012

No hay ninguna razón para exigir que las variables predictoras se transformen de la misma forma que las variables $Y$ -variable. Dependiendo de la naturaleza de las variables, este requisito puede no tener sentido. Por ejemplo, como en su caso, algunas de las variables explicativas son dummys---no tiene mucho sentido transformar dummys. Diferencias de escala entre las $Y$ -El algoritmo de estimación se ocupa de las variables y los predictores.

Para más información sobre las razones para transformarse -o no transformarse-, consulte las excelentes respuestas: ¿Por qué no transformar logarítmicamente todas las variables que no sean de interés principal?
¿Peligros que hay que evitar al transformar datos?

Una respuesta a una pregunta casi idéntica: Análisis de variables con transformación logarítmica y raíz cuadrada

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X