En el trabajo estábamos discutiendo esto ya que mi jefe nunca ha oído hablar de la normalización. En Álgebra Lineal, la normalización parece referirse a la división de un vector por su longitud. Y en estadística, la Normalización parece referirse a la sustracción de una media y luego dividirla por su SD. Pero también parecen intercambiables con otras posibilidades.
Cuando se crea algún tipo de puntuación universal, eso compone $2$ diferentes métricas, que tienen diferentes medios y diferentes SD, ¿normalizarías, estandarizarías o algo más? Una persona me dijo que es sólo cuestión de tomar cada métrica y dividirlas por su SD, individualmente. Luego sumando las dos. Y eso resultará en un puntaje universal que puede ser usado para juzgar ambas métricas.
Por ejemplo, digamos que tienes el número de personas que toman el metro para ir a trabajar (en la ciudad de Nueva York) y el número de personas que conducen para ir a trabajar (en la ciudad de Nueva York).
$$ \text {Train} \longrightarrow x$$ $$ \text {Car} \longrightarrow y$$
Si quisieras crear una puntuación universal para informar rápidamente de las fluctuaciones del tráfico, no puedes simplemente añadir $ \text {mean}(x)$ y $ \text {mean}(y)$ porque habrá MUCHA más gente que se suba al tren. Hay 8 millones de personas viviendo en la ciudad de Nueva York, además de los turistas. Eso es millones de personas que toman el tren todos los días verso cientos de miles de personas en los coches. Así que necesitan ser transformados a una escala similar para poder ser comparados.
Si $ \text {mean}(x) = 8,000,000$
y $ \text {mean}(y) = 800,000$
¿Normalizarías $x$ & $y$ entonces suma? ¿Estandarizarías $x$ & $y$ entonces suma? ¿O dividirías cada uno por su respectiva SD y luego sumarías? Para llegar a un número que cuando fluctúa, representa las fluctuaciones totales de tráfico.
Cualquier artículo o capítulo de libro para referencia sería muy apreciado. ¡GRACIAS!
También aquí hay otro ejemplo de lo que estoy tratando de hacer.
Imagina que eres el decano de una universidad y estás discutiendo los requisitos de admisión. Puede que quieras estudiantes con al menos un cierto promedio y una cierta puntuación en los exámenes. Sería bueno que ambos estuvieran en la misma escala porque entonces podrías sumar los dos y decir, "cualquiera con al menos un 7.0 puede ser admitido". De esa manera, si un estudiante tiene un promedio de 4.0, podría obtener un puntaje de 3.0 en el examen y aún así ser admitido. A la inversa, si alguien tiene un promedio de 3.0, puede ser admitido con un puntaje de 4.0.
Pero no es así. El ACT está en una escala de 36 puntos y la mayoría de los GPA están en 4.0 (algunos están en 4.3, sí molesto). Ya que no puedo simplemente añadir un ACT y un GPA para obtener algún tipo de puntuación universal, ¿cómo puedo transformarlos para que se puedan añadir, creando así una puntuación de admisión universal. Y luego, como decano, podría aceptar automáticamente a cualquiera con una puntuación superior a un cierto umbral. O incluso aceptar automáticamente a todos aquellos cuya puntuación esté dentro del 95% superior.... ese tipo de cosas.
¿Sería eso normalización? ¿normalización? o sólo dividir cada uno por su SD y luego sumar?
5 votos
La última parte de la pregunta suena como si estuvieras tratando de crear un valoración de múltiples atributos. Para más información, véase la pregunta y las respuestas en stats.stackexchange.com/q/9137 y stats.stackexchange.com/q/9358 . En particular, hay que tener en cuenta que ni la normalización ni la estandarización tienen una relevancia directa para el problema del decano.
1 votos
¿Podría aclarar el problema del metro? por qué "Hay 8 millones de personas viviendo en NYC, más los turistas" derivan $\text{mean}(x) = 8,000,000$ ?