9 votos

¿Puedo comprobar la correlación entre las variables antes de estandarizarlas?

Lo que quiero hacer es construir GLMM's para evaluar la selección de recursos, y tengo un conjunto de variables (algunas que representan distancias y otras que representan % de cobertura del suelo).

¿Puedo comprobar la correlación entre las variables antes de estandarizarlas? No estoy seguro de qué debo hacer primero.

16voto

Richard Hardy Puntos 6099

¿Puedo comprobar la correlación entre las variables antes de estandarizarlas? No estoy seguro de qué debo hacer primero.

La correlación será la misma independientemente de si se calcula antes o después de la estandarización. Para ver esto, basta con saber que la correlación es invariante a la escala. Tomemos $b \in \mathbb{R}$ y $a>0$ entonces

$$ \begin{aligned} \text{Corr}(aX-b,Y) &= \frac{\text{Cov}(aX-b,Y)}{\sqrt{\text{Var}(aX-b)}\sqrt{(\text{Var}(Y)}} \\ &= \frac{\text{Cov}(aX,Y)}{\sqrt{\text{Var}(aX)}\sqrt{\text{Var}(Y)}} \\ &= \frac{a \text{Cov}(X,Y)}{\sqrt{a^2 \text{Var}(X)}\sqrt{\text{Var}(Y)}} \\ &= \frac{a \text{Cov}(X,Y)}{a \sqrt{\text{Var}(X)}\sqrt{\text{Var}(Y)}} \\ &= \frac{\text{Cov}(X,Y)}{\sqrt{\text{Var}(X)}\sqrt{\text{Var}(Y)}} \\ &= \text{Corr}(X,Y) \end{aligned} $$

La primera igualdad es una definición.
La segunda utiliza la propiedad de que tanto la covarianza como la varianza son invariables a los cambios de ubicación.
La tercera utiliza las propiedades de la covarianza y la varianza con respecto a la multiplicación por una constante.
El cuarto utiliza el hecho de que $a>0$ .
El quinto sólo anula los multiplicadores.
La sexta es de nuevo una definición.

Esto incluye la estandarización, que consiste en restar la media y dividir por la desviación estándar (un número positivo).

0 votos

Muchas gracias por su respuesta, es muy clarificadora.

9voto

Mud Warrior Puntos 25

Sí, la verificación de las correlaciones entre sus variables explicativas forma parte de la exploración de datos, como se sugiere en Zuur et al. (2010) _Un protocolo de exploración de datos para evitar problemas estadísticos comunes_ . Esto debería hacerse antes de estandarizarlos y construir sus GLMM.

Sin embargo, no estoy seguro de cómo afectaría a las correlaciones el hecho de estandarizar primero las variables explicativas, pero supongo que los resultados de la correlación serían relativamente los mismos.

6voto

usεr11852 Puntos 5514

+1 a ambas respuestas, pero sólo para decir lo obvio:

La correlación lineal es definido como la versión escalada de la covarianza entre dos variables. La escala en sí es simplemente el producto de las desviaciones estándar de las dos variables. Por lo tanto, la normalización (o cualquier transformación lineal de las variables examinadas) no cambiará la correlación, ya que cualquier efecto de reescalado previo que pudiera afectar a la covarianza, será anulado por la normalización de la escala que da la estimación final de la correlación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X