¿En qué circunstancias se debe normalizar/estandarizar los datos al construir un modelo de regresión? Cuando le hice esta pregunta a un experto en estadísticas, me dio una respuesta ambigua "depende de los datos".
Pero, ¿qué significa realmente eso? Debería ser una regla universal o una lista de verificación donde si se cumplen ciertas condiciones entonces los datos deberían/ no deberían normalizarse.
2 votos
Debería ser una regla universal o una lista de verificación de algún tipo donde si se cumplen ciertas condiciones, los datos deberían o no deberían normalizarse. ¿Puedes justificar eso?
1 votos
¿Estás preguntando sobre la regresión lineal estándar, o sobre métodos penalizados como la regresión de ridge o LASSO?
0 votos
@MatthewDrury: Lo que quiero decir es que los datos deben normalizarse para construir todos los modelos de regresión (OLS, Logístico, etc) o hacerlo cuando no se cumplan ciertas condiciones como la varianza no constante...etc (hablando hipotéticamente)
0 votos
@EdM: Cualquier tipo de modelo de regresión
1 votos
Esta página tiene una extensa discusión sobre situaciones en las que la normalización/estandarización podría ser importante. Por favor revísela y edite su pregunta para incluir cualquier problema que crea que no se discutió adecuadamente allí.
1 votos
Gran parte del software estandarizará automáticamente las variables para sus cálculos internos. ¿Podrías aclarar, entonces, si estás preguntando sobre cómo calcular soluciones numéricas o sobre si es realmente necesario estandarizar las variables antes de aplicar el software de regresión?
0 votos
@whuber: Mi duda es la última, ¿es necesario?
0 votos
Ver también Cuándo y cómo utilizar variables explicativas estandarizadas en regresión lineal, Las variables suelen ajustarse (por ejemplo, estandarizarse) antes de crear un modelo, ¿cuándo es esto una buena idea y cuándo es mala?, & ¿Es centrar una solución válida para la multicolinealidad?