13 votos

Intuición tras los nombres de correlaciones "parciales" y "marginales

¿Alguien tiene una idea de por qué la correlación condicional entre 2 variables se llama correlación "parcial" y la correlación simple entre ellas (es decir, cuando no está condicionada a ninguna otra variable) se llama correlación "marginal"? ¿Cuál es la intuición detrás de las palabras "parcial" y "marginal"? ¿Qué tienen que ver con las "partes" o los "márgenes"?

Sería bueno aprender la respuesta para entender mejor esos conceptos.

13voto

Sean Hanley Puntos 2428

El término "marginal" es muy antiguo. Si nos remontamos lo suficiente en la historia, no existían las revistas científicas (evidentemente empezaron alrededor de 1665 ). En cambio, los resultados provisionales se comunicaban mediante cartas manuscritas y los resultados finales se escribían en libros. No solía haber muchos gráficos de datos antes de Playfair Pero los libros pueden tener a menudo tablas con números en diferentes condiciones. Considere esta tabla:
\begin{array} \ &A &B &C &D \\ I &x_{I,A} &x_{I,B} &x_{I,C} &x_{I,D} \\ II &x_{II,A} &x_{II,B} &x_{II,C} &x_{II,D} \\ III &x_{III,A} &x_{III,B} &x_{III,C} &x_{III,D} \\ IV &x_{IV,A} &x_{IV,B} &x_{IV,C} &x_{IV,D} \\ \end{array} Estos valores son todos condicional es decir, dan un número para una combinación específica de condiciones. Sin embargo, a veces los lectores quieren saber cómo es una condición concreta sin tener en cuenta la otra variable. Imagínese $x_{I,A}$ es el número de veces que ocurrió algo cuando la primera variable era $I$ y la segunda variable era $A$ . Entonces, alguien podría querer saber, ¿con qué frecuencia ocurría esto cuando la primera variable era $I$ sin importar cuál era la segunda variable? Es fácil resolverlo, sólo hay que sumar las $x$ s en la primera fila e ignorar las columnas. La gente solía hacer este tipo de cosas comúnmente, y (naturalmente) escribían los números en los márgenes del libro junto a la tabla. Mientras que los números originales son condicionales, no existía un nombre para estos otros tipos de números; se conocieron como " marginal ".

¿Qué tienen que ver esos números con las correlaciones? Bueno, no es una conexión directa, pero una vez que se tiene la idea de "no tener en cuenta otras variables", y se tiene un nombre para ello ("marginal"), cuando surge un nuevo contexto que es análogo (es decir, las correlaciones), simplemente se aplican el nombre y la idea.


No conozco la etimología de las correlaciones parciales, pero puedo darte la intuición. En realidad, es bastante sencillo: se trata de la correlación entre parte de una variable y parte de otra. Considere esta figura:

enter image description here

Podemos imaginar que el círculo de la izquierda es una variable $X$ el círculo de la derecha es una variable $Y$ y el círculo superior es una variable $Z$ . La correlación entre dos variables está relacionada con el grado de superposición de los círculos (de hecho, podemos imaginar que el área de los círculos representa la variabilidad de cada variable y que el porcentaje del área es $r^2$ ). Ahora está claro que hay una cierta correlación entre $X$ y $Y$ pero también hay cierta correlación entre $X$ y $Z$ y entre $Y$ y $Z$ . ¿Y si quisieras saber cuál es la correlación entre aquellas partes de $X$ y $Y$ que no estaban relacionados con $Z$ ? Esa sería la correlación parcial . Está relacionado con el solapamiento entre los dos piezas de los círculos que no incluyen las astillas superiores que se cruzan con el círculo superior.

Soy aficionado a esta página web por proporcionar una discusión fácil de entender sobre las correlaciones parciales y temas relacionados. Sólo la primera sección trata de las correlaciones parciales propiamente dichas, pero recomiendo encarecidamente la lectura de toda la página (aunque es bastante larga). Aunque no está directamente relacionado, la discusión en este hilo: ¿Dónde está la varianza compartida entre todos los IVs en una ecuación de regresión múltiple lineal? También puede ser útil.

0voto

Zachary F Puntos 336

La correlación $\rho_{XY}$ entre 2 variables $X,Y$ (que usted llama correlación marginal) indica que las muestras de ambas variables muestran cierta dependencia.

La correlación parcial $\rho_{XY \cdot Z}$ mide la correlación residual entre $X,Y$ una vez que la influencia de la variable de confusión $Z$ se ha eliminado por regresión lineal.

En términos matemáticos, esto se expresa como: $$\rho_{XY \cdot Z} := \frac{\rho_{XY}-\rho_{XZ}\rho_{YZ}}{\sqrt{1-\rho_{XZ}^2}\sqrt{1-\rho_{YZ}^2}}$$

Para ilustrar las propiedades que se derivan de esta definición, podemos considerar dos casos límite:

  • si $X$ y $Y$ están ambos correlacionados al 0% con la variable $Z$ , entonces la correlación parcial es la correlación: $$\rho_{XY \cdot Z} = \rho_{XY}$$

  • Si $Y$ tiene una correlación del 100% con $Z$ sin embargo, entonces la correlación parcial es siempre 0 sin importar el valor de $\rho_{XY}$ .

$$\rho_{XY \cdot Z} = 0$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X