22 votos

No hay correlación: correlaciones entre el género y el tamaño del cerebro y entre el tamaño del cerebro y el CI, pero no hay correlación entre el género y el CI

He encontrado la siguiente explicación en un blog y me gustaría obtener más información sobre la no transitividad de la correlación:

Tenemos los siguientes hechos indiscutibles:

  • Por término medio, existe una diferencia de volumen cerebral entre hombres y mujeres
  • Existe una correlación entre el CI y el tamaño del cerebro; la correlación es de 0,33 y corresponde, por tanto, al 10% de la variabilidad del CI

De estas premisas 1 y 2, parece deducirse lógicamente que: las mujeres tienen por término medio un coeficiente intelectual inferior al de los hombres. ¡Pero es una falacia! En estadística, las correlaciones no son transitivas. La prueba es que basta con mirar los resultados de los tests de CI y muestran que el CI de hombres y mujeres no difiere en promedio.

Me gustaría entender un poco más esta no-transitividad de la correlación.

Si la correlación entre el CI y el tamaño del cerebro fuera de 0,9 (que sé que no lo es (1)), ¿deducir que las mujeres tienen de media un CI inferior al de los hombres seguiría siendo una falacia?

Por favor, no estoy aquí para hablar del coeficiente intelectual (y de los límites del test), del sexismo, del estereotipo de la mujer, de la arrogancia, etc. (2). Sólo quiero entender el razonamiento lógico detrás de la falacia.


(1) que sé que no lo es: Los neandertales tenían el cerebro más grande que el homo sapiens, pero no eran más inteligentes;

(2) Soy mujer y, en general, no me considero, ni a las demás mujeres, menos inteligente que los hombres, no me importa el test de inteligencia, porque lo que cuenta es el valor de las personas, y no se basa en las capacidades intelectuales.


La fuente original en francés:

Tenemos los siguientes hechos indiscutibles:

  • existe una diferencia en el tamaño medio del cerebro entre hombres y mujeres
  • existe una correlación entre el coeficiente intelectual y el volumen cerebral; la correlación correlación es de 0,33 y, por tanto, corresponde al 10% de la variabilidad

De estas premisas 1 y 2, parece deducirse lógicamente que: las mujeres tienen por término medio un coeficiente intelectual inferior al de los hombres.

Pero esto es un error de razonamiento. En las estadísticas, el las correlaciones no son transitivas. La prueba es que para estar seguros, sólo hay que mirar los resultados de la para estar seguros, sólo hay que mirar los resultados de la Las pruebas de coeficiente intelectual demuestran que el coeficiente intelectual de hombres y mujeres no difiere por término medio. y las mujeres no difieren en promedio.

enter image description here

0 votos

Las preguntas de este tipo -sobre los efectos de varios tipos de heteregeneidad en los datos sobre la correlación global- no deberían considerarse tareas lógicas. Son, por así decirlo, temas de lógica difusa, y se resuelven contemplando los gráficos de dispersión de los datos en su esquema.

0 votos

En el caso actual, tenemos dos elipsoides inclinados (machos y hembras) desplazados uno respecto al otro en el eje X pero a igual nivel en el eje Y. La r global es moderada. Si se hacen los dos elipsoides muy finos sin cambiar sus posiciones, se puede conseguir un r global un poco más alto.

0 votos

Sin embargo, una gran r general necesitará que no sólo se diluyan las dos subnubes, sino que también se acerquen entre sí en X. Pero entonces significa que los machos y las hembras se vuelven menos distintos en X.

22voto

zowens Puntos 1417

Sí, seguiría siendo una falacia.

He aquí una figura muy sencilla que muestra cuatro situaciones diferentes. En cada caso, los puntos rojos representan a las mujeres, los azules a los hombres, el eje horizontal representa el tamaño del cerebro y el eje vertical representa el CI. He generado los cuatro conjuntos de datos de tal manera que:

  • siempre hay la misma diferencia en el tamaño medio del cerebro entre los hombres ( $22$ ) y las mujeres ( $28$ - las unidades son arbitrarias). Se trata de medias poblacionales, pero esta diferencia es lo suficientemente grande como para ser estadísticamente significativa con cualquier tamaño de muestra razonable;

  • siempre hay una diferencia nula en el coeficiente intelectual medio entre hombres y mujeres (ambos $100$ ), y también una correlación nula entre el género y el CI;

  • la fuerza de la correlación entre el tamaño del cerebro y el coeficiente intelectual varía como se muestra en la figura.

correlations

En el subgrupo superior izquierdo, la correlación dentro del género (calculada por separado sobre los hombres y por separado sobre las mujeres, y luego promediada) es $0.3$ como en tu cita. En la subtrama superior derecha la correlación global (sobre hombres y mujeres juntos) es $0.3$ . Tenga en cuenta que su presupuesto no especifica cuál es el número de $0.33$ se refiere. En la subtrama inferior izquierda la correlación dentro del género es $0.9$ como en su ejemplo hipotético; en la subtrama inferior derecha la correlación global es $0.9$ .

Así que puedes tener cualquier valor de correlación, y no importa si se calcula en general o dentro del grupo. Sea cual sea el coeficiente de correlación, es muy posible que haya una correlación cero entre el género y el CI y una diferencia cero entre los géneros en el CI medio.


Exploración de la no transitividad

Exploremos todo el espacio de posibilidades, siguiendo el enfoque sugerido por @kjetil. Supongamos que tenemos tres variables $x_1, x_2, x_3$ y (sin pérdida de generalidad) suponer que la correlación entre $x_1$ y $x_2$ es $a>0$ y la correlación entre $x_2$ y $x_3$ es $b>0$ . La pregunta es: ¿cuál es el mínimo valor positivo posible de la correlación $\lambda$ entre $x_1$ y $x_3$ ? ¿Acaso a veces tienen ser positivo, o puede ser siempre cero?

La matriz de correlación es $$\mathbf R = \left( \begin{array}{} 1&a&\lambda \\ a&1&b \\ \lambda &b&1 \end{array}\right)$$ y tiene que tener un determinante no negativo, es decir $$\mathrm{det} \mathbf R = -\lambda^2 + 2ab\lambda - ( a^2+b^2-1) \ge 0,$$ lo que significa que $\lambda$ tiene que estar entre $$ab \pm \sqrt{(1-a^2)(1-b^2)}.$$ Si ambas raíces son positivas, entonces el mínimo valor posible de $\lambda$ es igual a la raíz menor (y $\lambda$ tiene que ser positivo). Si el cero está entre estas dos raíces, entonces $\lambda$ puede ser cero.

Podemos resolverlo numéricamente y trazar el mínimo valor positivo posible de $\lambda$ para diferentes $a$ y $b$ :

Exploring non-transitivity

Informalmente, podríamos decir que las correlaciones serían transitivo si se da que $a>0$ y $b>0$ se podría concluir que $\lambda>0$ . Vemos que para la mayoría de los valores $a$ y $b$ , $\lambda$ puede ser cero, lo que significa que las correlaciones no son transitivas. Sin embargo, para algunos valores suficientemente altos de $a$ y $b$ , correlación $\lambda$ tiene que ser positivo lo que significa que existe "cierto grado de transitividad" después de todo, pero restringido a correlaciones muy altas solamente. Obsérvese que ambas correlaciones $a$ y $b$ tiene que ser alta.

Podemos elaborar una condición precisa para esta "transitividad": como se mencionó anteriormente, la raíz menor debe ser positiva, es decir $ab - \sqrt{(1-a^2)(1-b^2)}>0$ lo que equivale a $a^2+b^2>1$ . Se trata de la ecuación de un círculo. Y de hecho, si observas la figura anterior, te darás cuenta de que la región azul forma un cuarto de círculo.

En su ejemplo concreto, la correlación entre el género y el tamaño del cerebro es bastante moderada (quizás $a=0.5$ ) y la correlación entre el tamaño del cerebro y el CI es $b=0.33$ que se encuentra firmemente dentro de la región azul ( $a^2+b^2<1$ )lo que significa que $\lambda$ puede ser positivo, negativo o cero.


Figura relevante del estudio original

Has querido evitar la discusión sobre el género y los cerebros, pero no puedo dejar de señalar que mirando la cifra completa del artículo original ( Gur et al. 1999 ), se puede ver que, mientras que no hay diferencias de género en la puntuación del CI verbal, ¡hay una diferencia evidente y significativa en la puntuación del CI espacial! Compare los subgrupos D y F.

Gur et al.

4 votos

Me encantan esas tramas que has generado. Las del papel, no tanto...

0 votos

@ssdecontrol: Gracias. He publicado la figura completa del artículo porque me parece bastante típico que la única subtrama que se citó en esa entrada del blog francés sea la subtrama D, que no muestra ninguna diferencia en el CI entre géneros, mientras que las subtramas B y F sí muestran claramente una diferencia significativa.

0 votos

Me encanta. ¿Lo has hecho en matlab?

9voto

kjetil b halvorsen Puntos 7012

Definamos $x_1=\text{IQ}, x_2=\text{gender}$ y $x_3$ ser alguna otra variable (como el volumen cerebral) correlacionada con ambas. Supongamos que $$ \text{cor}(x_1, x_2)=\lambda, \\ \text{cor}(x_1,x_3)=\text{cor}(x_2, x_3)=\rho=0.9 $$ ¿Cuál es el menor valor posible para $\lambda$ ? Una matriz de correlación debe ser semidefinida positiva, por lo que su determinante debe ser no negativo. Esto puede ser explotado para dar una desigualdad. Intentémoslo:
La matriz de correlación es $$ R=\begin{pmatrix} 1 & \lambda & \rho \\ \lambda & 1 & \rho \\ \rho & \rho & 1 \end{pmatrix} $$ Entonces podemos calcular el determinante de $\rho$ expandiéndose a lo largo de la primera fila: $$ \det R = 1\cdot (1-\rho^2) - \lambda \cdot (\lambda-\rho^2) + \rho \cdot (\lambda \rho - \rho) \\ = 1-\lambda^2 -2\rho^2 + 2\lambda \rho^2 \ge 0, $$ lo que lleva a la desigualdad $\rho^2 \le \frac{\lambda+1}{2}$ . El valor $\rho=0.9$ lleva a $ \lambda \ge 0.62$ .

Actualización:

En respuesta a los comentarios, he actualizado un poco la respuesta anterior. Ahora, ¿qué podemos hacer con esto? Según los cálculos anteriores, una correlación de 0,9 entre el CI y el volumen cerebral (mucho mayor que la empírica). Entonces, la correlación entre el género y el CI debe ser de al menos 0,62. ¿Qué significa esto? En los comentarios algunos dicen que esto no implica nada sobre las diferencias medias entre géneros. Pero eso no puede ser cierto. Sí, para las variables con distribución normal podemos asignar la correlación y las medias sin relación. Pero el género es una variable cero-uno, para tal variable hay es una relación entre la correlación y las diferencias medias. Concretamente, el CI se distribuye (digamos) normalmente, mientras que el género es discreto, cero-uno. Supongamos su media $p=0.5$ (de forma realista). Entonces una correlación (digamos) positiva significa que el género tiende a ser "más alto" (es decir, uno) si el CI es más alto. ¡Eso no puede ocurrir sin que haya una diferencia media! Hagamos el álgebra: En primer lugar, para simplificar el álgebra, centremos el CI en cero en lugar del 100 habitual. Esto no cambiará ninguna correlación o diferencia media. Dejemos que $\mu_1 = \text{E}(x_1 | x_2=1)$ y $\mu_0 = \text{E}(x_1 | x_2=0)$ . Con $\mu=\text{E}(x_1)$ esto significa $\mu=0=\mu_1+\mu_0$ desde $\mu_0 = -\mu_1$ . Tenemos $x_1 \sim \text{N}(\mu=0, \sigma^2)$ y $x_2$ es Bernoulli con $p=1/2$ .
$$ \text{corr}(x_1, x_2) = \frac{\text{E}(x_1-\mu)\text{E}(x_2-p)}{\sigma \cdot \frac12} \\ = \frac{\Delta}{2\sigma} $$ donde $\Delta = \mu_1 - \mu_0 = 2\mu_1$ . Con el valor habitual (para IQ) $\sigma=10$ esto da que la correlación es igual a $\Delta/20$ . Así que una correlación de 0,62 significa una diferencia de CI de 12,4. Así que los carteles que afirman la correlación contienen no ¡información sobre la diferencia media del CI son erróneas! Esto sería cierto si el género fuera una variable continua, que obviamente no lo es. Obsérvese que este hecho está relacionado con el hecho de que para la distribución binomial, la varianza es una función de la media (como debe ser, ya que sólo hay un parámetro libre para variar). Lo que hemos hecho arriba es realmente extender esto a la covarianza/correlación.

Pero, según el OP, el verdadero valor de $\rho=0.33$ . Entonces la desigualdad se convierte en que $\lambda \ge -0.7822$ Así que $\lambda=0$ es un valor posible. Por lo tanto, en el caso real, no se pueden extraer conclusiones sobre las diferencias medias en el CI a partir de la correlación entre el CI y el volumen cerebral.

1 votos

Y cómo $\mathrm{cor}(x_1, x_2)\ge 0.62$ nos ayuda a deducir (aunque de forma falible) $E(x_1)\geq E(x_2)$ ? ¿Me estoy perdiendo algo fundamental?

5 votos

+1 - Pero me parece que el concepto de correlación entre los coeficientes intelectuales de hombres y mujeres es algo confuso, ya que nunca se podría calcular dicho valor.

1 votos

¿Qué significa la correlación entre el CI de los hombres y el de las mujeres?

7voto

Judioo Puntos 625

Esta es una situación en la que me gusta utilizar diagramas de recorrido para ilustrar directo efectos y indirecta efectos, y cómo esos dos influyen en las correlaciones generales.

De acuerdo con la descripción original, tenemos una matriz de correlación a continuación. El tamaño del cerebro tiene una correlación de alrededor de 0,3 con el CI, la mujer y el CI tienen una correlación de 0 entre sí. La correlación negativa entre la mujer y el tamaño del cerebro es de -0,3 (si tuviera que adivinar es mucho más pequeño que eso, pero esto servirá para ilustrar).

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

Si ajustamos un modelo de regresión en el que el CI es una función del tamaño del cerebro y del hecho de ser mujer, podemos ilustrarlo con un diagrama de recorrido. He rellenado los coeficientes de regresión parcial en las flechas, y el nodo B representa el tamaño del cerebro y el nodo F representa a la mujer.

enter image description here

Ahora bien, lo loco es que, al controlar el tamaño del cerebro, dadas estas correlaciones, las mujeres tienen una relación positiva con el CI. ¿Por qué es esto, cuando la correlación marginal es cero? Según las reglas con diagramas de trayectoria lineal ( Wright, 1934 ), podemos descomponer la correlación marginal en función del efecto directo al controlar el tamaño del cerebro y el efecto indirecto:

$$\text{Total}_{\text{F},\text{IQ}} = \text{Direct}_{\text{F},\text{IQ}} + \text{Indirect}_{\text{F},\text{B},\text{IQ}}$$

En esta notación $\text{Total}_{\text{F},\text{IQ}} = \text{Cor}(\text{F},\text{IQ})$ . Así que según la definición original conozca este efecto total sea cero. Así que ahora sólo tenemos que calcular el efecto directo y el efecto indirecto. El efecto indirecto en este diagrama es simplemente seguir la otra flecha de las mujeres al CI a través del tamaño del cerebro, que es la correlación de las mujeres y el tamaño del cerebro multiplicado por el correlación parcial del tamaño del cerebro y el coeficiente intelectual.

\begin{align} \text{Indirect}_{\text{F},\text{B},\text{IQ}} &= \text{Cor}(\text{F},\text{B}) \cdot \text{Cor}(\text{B},\text{IQ}|\text{F}) \\ -0.099 &= -0.3 \cdot 0.33 \end{align}

Como el efecto total es cero, sabemos que el efecto directo debe ser simplemente el signo y tamaño exactamente opuestos del efecto indirecto por lo que el efecto directo es igual a 0,099 en este ejemplo. Ahora bien, aquí tenemos una situación en la que al evaluar el CI esperado de las mujeres obtenemos dos respuestas diferentes, aunque probablemente no sea lo que usted esperaba inicialmente al especificar la pregunta. Cuando simplemente se evalúa el CI marginal esperado de las mujeres frente al de los hombres, la diferencia es cero, tal y como usted la definió (al tener una correlación cero). Cuando se evalúa la diferencia esperada condicionada al tamaño del cerebro, las mujeres tienen un CI mayor que los hombres.

Puedes insertar en este ejemplo correlaciones más grandes entre el tamaño del cerebro y el CI (o correlaciones más pequeñas entre la mujer y el tamaño del cerebro), dados los límites que muestra kjetil en su respuesta. El aumento de la primera hace que la disparidad entre el CI condicional de las mujeres y los hombres sea aún mayor a favor de las mujeres, la disminución de la segunda hace que las diferencias sean menores.

0 votos

Si se observa la imagen proporcionada, muestra una correlación positiva (y más fuerte que la de los hombres) del volumen cerebral de las mujeres con el coeficiente intelectual.

1 votos

@Andy W Me da mucha vergüenza hacer esta pregunta tonta, pero ¿qué software has utilizado para dibujar el gráfico de nodos?

1 votos

Fue un trabajo rápido en inkscape @mugen. Tomando más tiempo creo que los que hago usando Látex y Tikz son más agradables.

3voto

Jeff Bauer Puntos 236

Para dar la respuesta matemática puramente abstracta, denote $v$ el volumen del cerebro y $q$ el índice IQ. Utilice $1$ para indexar a los hombres y $2$ para indexar a las mujeres. Supongamos que los siguientes son hechos:

$$E(v_1) > E(v_2) = \beta E(v_1), 0< \beta <1, \;\; \rho(v_1,q_1) >0, \;\; \rho(v_2,q_2)>0 \tag{1}$$

Obsérvese que mientras el texto citado habla de "correlación entre el volumen cerebral y el CI" en general, la imagen suministrada hace una distinción con las dos líneas de tendencia (es decir, muestra la correlación para los dos subgrupos por separado). Así que los consideramos por separado (que es lo correcto).

Entonces

$$\rho(v_1,q_1) >0 \Rightarrow {\rm Cov}(v_1,q_1)>0 \Rightarrow E(v_1q_1) > E(v_1)E(q_1)$$

$$\Rightarrow \frac {E(v_1q_1)}{E(q_1)} > E(v_1) \tag{2}$$

y

$$\rho(v_2,q_2) >0 \Rightarrow {\rm Cov}(v_2,q_2)>0 \Rightarrow E(v_2q_2) > E(v_2)E(q_2)$$

$$\Rightarrow \frac {E(v_2q_2)}{\beta E(q_2)} > E(v_1) \tag{3}$$

¿Las desigualdades obtenidas anteriormente requieren $E(q_1) > E(q_2)$ ??

Para comprobarlo supongamos, por el contrario, que $E(q_1) = E(q_2) = \bar q \tag {4}$

Entonces debe ser el caso que

$$(2),(4) \Rightarrow \frac {E(v_1q_1)}{\bar q} > E(v_1) \tag{5}$$

y que

$$(3),(4) \Rightarrow \frac {E(v_2q_2)}{\beta \bar q} > E(v_1) \tag{6}$$

Bueno, ciertamente puede sea el caso, que las desigualdades $(5)$ y $(6)$ se mantienen al mismo tiempo, por lo que "un coeficiente intelectual igual en promedio" es perfectamente compatible con los supuestos iniciales que tomamos como hechos.
De hecho, podría muy bien ocurrir que tuviéramos un coeficiente intelectual medio más alto de las mujeres que de los hombres, para el mismo conjunto de hechos en $(1)$ .

En otras palabras, los supuestos/factos de correlación en $(1)$ no imponen ningún tipo de restricción sobre la relación entre los coeficientes intelectuales medios. Toda posible relación entre $E(q_1)$ y $E(q_2)$ puede mantenerse, y ser compatible con los supuestos de $(1)$ .

2 votos

A pesar de todos los cálculos mostrados aquí, sigo sin ver cómo la correlación revela algo en absoluto (o impone alguna restricción) sobre las relaciones entre media valores.

0 votos

@whuber Toda la respuesta consiste en demostrar que no es así. Las últimas frases dicen exactamente eso. Añadamos una más al respecto.

0 votos

Pero esto es absolutamente básico: ¡no hace falta una página entera de ecuaciones para demostrarlo! Basta con observar que los coeficientes de correlación son invariantes de la ubicación, QED . ¿He interpretado mal la pregunta?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X