Me pregunto si hay algún problema teórico al tomar la media de dos variables estandarizadas. Supongamos que quiero combinar dos variables para tener una única medida. Podría crear un índice utilizando medias ponderadas o PCA. Me preguntaba si hay algún impedimento teórico para estandarizar cada variable y luego tomar la media aritmética.
Respuesta
¿Demasiados anuncios?Sí, creo que se encontraría con grandes problemas. El primero es que la media de dos variables estandarizadas podría carecer de significado. Digamos que la variable A tiene un valor estandarizado de - 3,0 y la variable B un valor estandarizado de + 3,0. Su media es 0. La media ha borrado esencialmente el hecho de que ambas variables están estandarizadas. Su media es 0. La media ha borrado esencialmente el hecho de que ambas variables tenían un valor extremo a 3 desviaciones estándar de su Media respectiva. El segundo problema también está asociado a la ausencia de significado cuando se promedian dos variables que tienen una escala completamente diferente. Supongamos que la variable A tiene una escala 100 veces superior a la de la variable B. Si promediamos la variable A con la variable B, la media de la variable A a 2,0 y la variable B a 0,0 es la misma que la media de la variable A a 0,0 y la variable B a 2,0. Sin embargo, la media de la variable A a 0,0 y la variable B a 2,0 es la misma. Pero, cuando entiendes las composiciones subyacentes de esas dos medias diferentes, tienen un significado completamente diferente que queda enmascarado por su media idéntica.