Lo primero es lo primero, no creo que hay muchas preguntas de la forma "Es una buena práctica siempre X en el aprendizaje de máquina", donde la respuesta va a ser la definitiva. Siempre? Siempre siempre? A través paramétricos, no paramétricos, Bayesiano, Monte Carlo, ciencias sociales, puramente matemático, y millones característica de los modelos? Que estaría bien, ¿no es!
Concretamente, si bien, aquí están algunas de las formas en que: solo de ti depende.
Algunas veces, cuando la normalización es buena:
1) Varios algoritmos, en particular SVMs vienen a la mente, a veces puede converge mucho más rápido en los datos normalizados (aunque por qué, precisamente, no recuerdo).
2) Cuando el modelo es sensible a la magnitud y las unidades de dos características diferentes son diferentes, y arbitrario. Esto es como el caso que usted sugiere, en la que algo se hace más influencia de lo que debería.
Pero por supuesto, no todos los algoritmos son sensibles a la magnitud de la manera que usted sugiere. Lineal de los coeficientes de regresión será el mismo si se hace, o no, la escala de sus datos, ya que mirando proporcional de las relaciones entre ellos.
Algunas veces, cuando la normalización es malo:
1) Cuando se desea interpretar sus coeficientes, y no normalizar bien. La regresión en algo como dólares te da un resultado significativo. La regresión en proporción-de-máximo-dinero-en-la muestra puede que no.
2) Cuando, en realidad, las unidades en sus características son significativas, y la distancia no hacer una diferencia! De vuelta a la SVMs -- si usted está tratando de encontrar un max-margen de clasificador, entonces las unidades que van en los que 'max' de la materia. Las características de escala para los algoritmos de clustering puede cambiar sustancialmente el resultado. Imaginar cuatro grupos alrededor del origen, cada uno en diferentes cuadrantes, todos muy bien a escala. Ahora, imagine que el eje de las y se estiró a diez veces la longitud del eje de las x. en lugar de cuatro cuadrantes: clústeres, usted va a obtener el largo aplastado baguette de datos cortada en cuatro trozos a lo largo de su longitud! (Y, la parte importante es, usted podría preferir cualquiera de estos!)
Estoy seguro de insatisfacción en resumen, la mayoría de la respuesta general es que usted necesita preguntarse a sí mismo muy en serio lo que hace sentido con los datos, y el modelo que está utilizando.