25 votos

Variables estandarizadas VS centradas

He encontrado muchos posts útiles sobre variables independientes estandarizadas y variables independientes centradas en stats.stackexchange.com pero sigo un poco confuso. Le pido una evaluación de lo que he entendido. Además, si lo que sigue no es correcto, ¿podría corregirme?

  1. Cómo normalizar. Las variables estandarizadas se obtienen restando la media de la variable y dividiendo por la desviación típica de esa misma variable.
  2. Cómo centrarse. Las variables independientes centradas se obtienen simplemente restando la media de la variable.
  3. La razón de la normalización. Las variables se estandarizan para facilitar la interpretación de los coeficientes estimados cuando las variables de la regresión tienen diferentes unidades de medida. Cuando desee estandarizar, tendrá que estandarizar todas las variables de la regresión, lo que implica que no obtendrá una estimación de la constante (es decir, la B0 o intercepción).
  4. La razón de centrarse. Debe centrar las variables si desea obtener una interpretación significativa de la constante estimada. En este caso, puede centrar la cantidad de variables que desee; no es necesario centrar todas las variables independientes del modelo.
  5. La variable dependiente, Y. (pregunta simple) ¿Alguna vez centra o estandariza la Y?
  6. Utilización del logaritmo natural. Si una o más de sus variables no se distribuyen normalmente, puede transformarlas utilizando el logaritmo natural. Sólo DESPUÉS de esta transformación puede estandarizar todas las variables o centrar las que necesite centrar. En general, cualquier transformación de una variable tiene que ocurrir antes de estandarizar o centrar (aquí hablo de logaritmo natural, pero podría elevar al cuadrado una variable o dividir una variable por otra, por ejemplo, población/km2)
  7. Coeficientes de interpretación variables estandarizadas. "Un aumento de 1 desviación típica en X1 aumentará (o disminuirá) Y en -número-".
  8. Coeficientes de interpretación variables centradas. Coeficientes de variables aleatorias: "Un aumento de X1 en -número- respecto a su media aumentará (o disminuirá) Y en -número-". Constante: "Representa el valor esperado de Y cuando las variables no centradas son cero y cuando las variables centradas están en su media."
  9. Términos de interacción. La interpretación del coeficiente de un término de interacción no debería ser problemática, tanto si ha estandarizado sus variables como si las ha centrado (ya sea sólo una variable de la interacción o las dos). Básicamente, la interpretación es la que se da normalmente a un término de interacción (por ejemplo, está interesado en el efecto de X1 sobre Y y X1 interactúa con X2, el efecto total de X1 viene dado por su coeficiente + el coeficiente del término de interacción cuando X2 es fijo), sólo recuerde contextualizar la interpretación siguiendo el punto 7 u 8, dependiendo del tipo de transformación que haya realizado.

14voto

naumcho Puntos 116
  1. Se estandarizan las variables para comparar la importancia de las variables independientes en la determinación de las variables de resultado.
  2. Es posible que desee centrar una variable cuando utilice un término de interacción: su efecto será interpretable de forma significativa si el valor mínimo de una de las variables interactuadas no es cero.
  3. Si realiza una regresión de diferentes variables de resultado (con diferentes escalas) sobre el mismo conjunto de variables independientes, puede comparar de forma significativa los coeficientes estimados.
  4. Sí.
  5. Sí.
  6. Sí, pero ten en cuenta el punto 4.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X