286 votos

¿Cómo explicarías la covarianza a alguien que sólo entiende la media?

...suponiendo que sea capaz de aumentar sus conocimientos sobre la varianza de forma intuitiva ( Entender la "varianza" de forma intuitiva ) o diciendo: Es la distancia media de los valores de los datos con respecto a la 'media' - y como la varianza está en unidades cuadradas, tomamos la raíz cuadrada para mantener las unidades iguales y eso se llama desviación estándar.

Supongamos que todo esto está articulado y (esperemos) entendido por el "receptor". Ahora, ¿qué es la covarianza y cómo se explicaría en un lenguaje sencillo, sin utilizar términos o fórmulas matemáticas? (Es decir, una explicación intuitiva. ;)

Atención: conozco las fórmulas y las matemáticas que hay detrás del concepto. Quiero ser capaz de "explicar" lo mismo de una manera fácil de entender, sin incluir las matemáticas; es decir, ¿qué significa "covarianza"?

2 votos

@Xi'an - "cómo" lo definirías exactamente mediante una regresión lineal simple ? Me gustaría saberlo...

4 votos

Suponiendo que ya tienes un gráfico de dispersión de tus dos variables, x contra. y, con el origen en (0,0), simplemente dibuje dos líneas en x=media(x) (vertical) e y=media(x) (horizontal): utilizando este nuevo sistema de coordenadas (el origen está en (media(x),media(y)), ponga un signo "+" en los cuadrantes superior derecho e inferior izquierdo, un signo "-" en los otros dos cuadrantes; obtuvo el signo de la covarianza, que es básicamente lo que dijo @Peter . El escalado de las unidades x e y (por SD) conduce a un resumen más interpretable, como se discute en el hilo conductor .

2 votos

@chl - ¡podría publicar eso como respuesta y tal vez usar gráficos para representarlo!

517voto

jldugger Puntos 7490

A veces podemos "aumentar los conocimientos" con un enfoque inusual o diferente. Me gustaría que esta respuesta fuera accesible para los niños de jardín de infancia y que también fuera divertida, así que ¡todo el mundo saque sus lápices de colores!

Dada la pareja $(x,y)$ datos, dibujar su gráfico de dispersión. (Los alumnos más jóvenes pueden necesitar que un profesor lo realice por ellos. :-) Cada par de puntos $(x_i,y_i)$ , $(x_j,y_j)$ en ese gráfico determina un rectángulo: es el rectángulo más pequeño, cuyos lados son paralelos a los ejes, que contiene esos puntos. Así, los puntos se encuentran en los ángulos superior derecho e inferior izquierdo (una relación "positiva") o se encuentran en los ángulos superior izquierdo e inferior derecho (una relación "negativa").

Dibuja todos los rectángulos posibles. Colócalos de forma transparente, haciendo que los rectángulos positivos sean rojos (digamos) y los negativos "antirrojos" (azules). De este modo, cuando los rectángulos se superponen, sus colores se realzan cuando son iguales (azul y azul o rojo y rojo) o se anulan cuando son diferentes.

Positive and negative rectangles

( En esta ilustración de un rectángulo positivo (rojo) y negativo (azul), la superposición debería ser blanca; lamentablemente, este software no tiene un verdadero color "anti-rojo". El solapamiento es gris, por lo que oscurecerá el gráfico, pero en general el red cantidad de rojo es correcta. )

Ahora estamos listos para la explicación de la covarianza.

La covarianza es la cantidad neta de rojo en la parcela (tratando los azules como valores negativos).

Aquí hay algunos ejemplos con 32 puntos binormales extraídos de distribuciones con las covarianzas dadas, ordenados de más negativo (más azul) a más positivo (más rojo).

Covariance plots, updated 2019

Se dibujan sobre ejes comunes para que sean comparables. Los rectángulos están ligeramente delineados para ayudar a verlos. Esta es una versión actualizada (2019) del original: utiliza un software que anula adecuadamente los colores rojo y cian en los rectángulos superpuestos.

Deduzcamos algunas propiedades de la covarianza. La comprensión de estas propiedades estará al alcance de cualquiera que haya dibujado unos cuantos rectángulos. :-)

  • Bilinealidad. Como la cantidad de rojo depende del tamaño del gráfico, la covarianza es directamente proporcional a la escala del eje x y a la escala del eje y.

  • Correlación. La covarianza aumenta cuando los puntos se aproximan a una línea ascendente y disminuye cuando los puntos se aproximan a una línea descendente. Esto se debe a que en el primer caso la mayoría de los rectángulos son positivos y en el segundo, la mayoría son negativos.

  • Relación con las asociaciones lineales. Como las asociaciones no lineales pueden crear mezclas de rectángulos positivos y negativos, dan lugar a covarianzas imprevisibles (y poco útiles). Las asociaciones lineales pueden interpretarse plenamente mediante las dos caracterizaciones anteriores.

  • Sensibilidad a los valores atípicos. Un valor atípico geométrico (un punto alejado de la masa) creará muchos rectángulos grandes en asociación con todos los demás puntos. Por sí solo puede crear una cantidad neta positiva o negativa de rojo en la imagen global.

Por cierto, esta definición de covarianza sólo se diferencia de la habitual por una constante universal de proporcionalidad (independiente del tamaño del conjunto de datos). Los matemáticos no tendrán ningún problema para demostrar algebraicamente que la fórmula dada aquí es siempre el doble de la covarianza habitual.

40 votos

Ahora bien, si todos los conceptos estadísticos introductorios pudieran presentarse a los estudiantes de esta manera tan lúcida

3 votos

@whuber: Deberías dejar de editar posts y empezar a publicar respuestas ;) ¡Simplemente impresionante!

8 votos

Esto es hermoso. Y muy muy claro.

92voto

DavLink Puntos 101

Para ampliar mi comentario, yo solía enseñar la covarianza como una medida de la covariación (media) entre dos variables, digamos $x$ y $y$ .

Es útil recordar la fórmula básica (sencilla de explicar, no hace falta hablar de expectativas matemáticas para un curso introductorio):

$$ \text{cov}(x,y)=\frac{1}{n}\sum_{i=1}^n(x_i-\bar x)(y_i-\bar y) $$

para que veamos claramente que cada observación $(x_i,y_i)$ pueden contribuir positiva o negativamente a la covarianza, dependiendo del producto de su desviación de la media de las dos variables, $\bar x$ y $\bar y$ . Nótese que aquí no hablo de magnitud, sino simplemente del signo de la contribución de la i-ésima observación.

Esto es lo que he representado en los siguientes diagramas. Los datos artificiales se generaron utilizando un modelo lineal (izquierda, $y = 1.2x + \varepsilon$ ; derecha, $y = 0.1x + \varepsilon$ , donde $\varepsilon$ se extrajeron de una distribución gaussiana con media cero y $\text{SD}=2$ y $x$ de una distribución uniforme en el intervalo $[0,20]$ ).

enter image description here

Las barras verticales y horizontales representan la media de $x$ y $y$ respectivamente. Eso significa que en lugar de "mirar las observaciones individuales" desde el origen $(0,0)$ podemos hacerlo desde $(\bar x, \bar y)$ . Esto equivale a una traslación en los ejes x e y. En este nuevo sistema de coordenadas, toda observación situada en el cuadrante superior derecho o inferior izquierdo contribuye positivamente a la covarianza, mientras que las observaciones situadas en los otros dos cuadrantes contribuyen negativamente a ella. En el primer caso (izquierda), la covarianza es igual a 30,11 y la distribución en los cuatro cuadrantes se da a continuación:

   +  -
+ 30  2
-  0 28

Evidentemente, cuando el $x_i$ están por encima de su media, también lo hacen los correspondientes $y_i$ 's (wrt. $\bar y$ ). La forma de la nube de puntos en 2D, cuando $x$ los valores aumentan $y$ los valores tienden a aumentar también. (Pero recuerda que también podríamos utilizar el hecho de que existe una clara relación entre la covarianza y la pendiente de la recta de regresión, es decir $b=\text{Cov}(x,y)/\text{Var}(x)$ .)

En el segundo caso (a la derecha, el mismo $x_i$ ), la covarianza es igual a 3,54 y la distribución entre cuadrantes es más "homogénea", como se muestra a continuación:

   +  -
+ 18 14
- 12 16

En otras palabras, hay un mayor número de casos en los que el $x_i$ y $y_i$ no covarían en la misma dirección con respecto a sus medias.

Obsérvese que podríamos reducir la covarianza escalando cualquiera de los dos $x$ o $y$ . En el panel izquierdo, la covarianza de $(x/10,y)$ (o $(x,y/10)$ ) se reduce en una cantidad diez veces mayor (3,01). Dado que las unidades de medida y la dispersión de $x$ y $y$ (en relación con sus medias) dificultan la interpretación del valor de la covarianza en términos absolutos, generalmente escalamos ambas variables por sus desviaciones estándar y obtenemos el coeficiente de correlación. Esto significa que, además de volver a centrar nuestra $(x,y)$ gráfico de dispersión a $(\bar x, \bar y)$ también escalamos la unidad x e y en términos de desviación estándar, lo que conduce a una medida más interpretable de la covariación lineal entre $x$ y $y$ .

45voto

Zizzencs Puntos 1358

La covarianza es una medida de cuánto sube una variable cuando sube la otra.

4 votos

¿Es siempre en la misma dirección? Además, ¿se aplica también a las relaciones inversas (es decir, cuando una sube la otra baja)?

0 votos

Creo que eso es lo que determina el signo de la covarianza... según mi "respuesta" publicada

7 votos

@nupul Bueno, lo contrario de "arriba" es "abajo" y lo contrario de "positivo" es "negativo". He intentado dar una respuesta de una sola frase. La tuya es mucho más completa. Incluso tu "cómo cambian dos variables juntas" es más completa, pero, creo, un poco más difícil de entender.

19voto

goingglacial Puntos 161

I soy respondiendo a mi propia pregunta, pero he pensado que sería bueno que las personas que se encuentren con este post revisen algunas de las explicaciones en esta página .

Estoy parafraseando una de las respuestas muy bien articuladas (por un usuario'Zhop'). Lo hago por si acaso ese sitio cierra o la página es retirada cuando alguien dentro de eones acceda a este post ;)

La covarianza es una medida de cuánto cambian dos variables juntas. Compárela con la varianza, que es simplemente el rango sobre el que una medida (o variable) varía.

Al estudiar los patrones sociales, se podría plantear la hipótesis de que los más ricos más ricas son más educadas, por lo que se trataría de ver la cercanía de las medidas de riqueza y educación. las medidas de riqueza y educación se mantienen juntas. Se utilizaría una medida de covarianza para determinarlo.

...

No estoy seguro de lo que quieres decir cuando preguntas cómo se aplica a la estadística. Es una medida que se enseña en muchas clases de estadística. ¿Te refieres a quiere decir, ¿cuándo se debe utilizar?

Se utiliza cuando se quiere ver cuánto cambian dos o más variables en relación con las demás.

Piensa en las personas de un equipo. Observa cómo varían en la ubicación geográfica ubicación geográfica en comparación con los demás. Cuando el equipo está jugando o practicando, la distancia entre los miembros individuales es muy pequeña y diríamos que están en la misma ubicación. Y cuando su ubicación cambia, cambia para todos los individuos juntos (por ejemplo, viajando en un autobús a un partido). En esta situación, diríamos que tienen un alto nivel de covarianza. Pero cuando no están jugando, la tasa de covarianza es probable que sea bastante baja, porque todos van a diferentes lugares a diferentes velocidades.

Así que puede predecir la ubicación de un miembro del equipo, basándose en otro equipo miembro del equipo cuando están practicando o jugando un partido con un alto grado de precisión. La medida de la covarianza sería cercana a 1, creo. Pero cuando no están practicando o jugando, tendrías una posibilidad mucho menor de predecir la ubicación de una persona, basándose en la ubicación de un miembro del equipo. Estaría cerca de cero, probablemente, aunque no cero, ya que a veces los miembros del equipo serán amigos, y pueden ir a lugares juntos en su tiempo libre.

Sin embargo, si se seleccionan al azar individuos en los Estados Unidos, y tratas de usar uno de ellos para predecir las ubicaciones de los otros, encontrarías probablemente encontrarías que la covarianza era cero. En otras palabras, no hay absolutamente ninguna relación entre la ubicación de una persona seleccionada al azar en los Estados Unidos, y la de otra.

Añadiendo otro (por @CatofGrey) que ayuda a aumentar la intuición:

En la teoría de la probabilidad y la estadística, la covarianza es la medida de cómo dos variables aleatorias varían juntas (a diferencia de la varianza, que mide cuánto varía una sola variable).

Si dos variables tienden a variar juntas (es decir, cuando una de ellas es por encima de su valor esperado, entonces la otra variable tiende a estar por encima su valor esperado), entonces la covarianza entre las dos variables será positiva. Por otro lado, si una de ellas está por encima de su valor esperado y la otra variable tiende a estar por debajo de su valor esperado, entonces la covarianza entre las dos variables será negativa.

Estos dos juntos me han hecho entender la covarianza como nunca antes la había entendido. ¡¡Simplemente increíble!!

19 votos

Aunque estas descripciones son cualitativamente sugerentes, lamentablemente son incompletas: no distinguen la covarianza de la correlación (la primera descripción parece confundir las dos, de hecho), ni ponen de manifiesto el supuesto fundamental de lineal covariación. Además, ninguno de ellos aborda el importante aspecto de que la covarianza depende (linealmente) de la escala de cada variable.

1 votos

@whuber - ¡de acuerdo! Y de ahí que no haya marcado la mía como respuesta :) (todavía no ;)

17voto

alexn Puntos 25639

Me gusta mucho la respuesta de Whuber, así que he reunido más recursos. La covarianza describe tanto el grado de dispersión de las variables como la naturaleza de su relación.

La covarianza utiliza rectángulos para describir lo lejos que está una observación de la media en un gráfico de dispersión:

  • Si un rectángulo tiene los lados largos y la anchura alta o los lados cortos y la anchura corta, proporciona evidencia de que las dos variables se mueven juntas.

  • Si un rectángulo tiene dos lados que son relativamente largos para esa variable, y dos lados que son relativamente cortos para la otra variable, esta observación proporciona evidencia de que las variables no se mueven muy bien juntas.

  • Si el rectángulo está en el 2º o 4º cuadrante, entonces cuando una variable es mayor que la media, la otra es menor que la media. El aumento de una variable se asocia a la disminución de la otra.

He encontrado una buena visualización de esto en http://sciguides.com/guides/covariance/ , Explica lo que es la covarianza si sólo conoces la media.

8 votos

+1 Buena explicación (especialmente ese resumen introductorio de una frase). El enlace es interesante. Como no tiene archivo en el Máquina de retroceso es probable que sea nuevo. Como es tan parecida a mi respuesta (de hace tres años), hasta la elección del rojo para las relaciones positivas y el azul para las negativas, sospecho que es un derivado (no atribuido) del material de este sitio.

7 votos

El enlace de "visualización genial" ha muerto... .

0 votos

@whuber: Gracias de nuevo. Estoy tratando de demostrar analíticamente que los puntos en el círculo, es decir, y = \pm (1-x^2) no están correlacionados. Para ello, necesito la distribución conjunta (X,Y). ¿Puedes ayudarme a resolverlo?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X