8 votos

Hay límites en la correlación de Spearman de una suma de dos variables?

Dado $n$-vectores $x, y_1, y_2$ de manera tal que el coeficiente de correlación de Spearman de $x$$y_i$$\rho_i = \rho(x,y_i)$, son no conoce límites en el coeficiente de Spearman de $x$$y_1 + y_2$, en términos de la $\rho_i$ (e $n$, presumiblemente)? Es decir, uno puede encontrar (no trivial) funciones de $l(\rho_1,\rho_2,n), u(\rho_1,\rho_2,n)$ tal que $$l(\rho_1,\rho_2,n) \le \rho(x,y_1+y_2) \le u(\rho_1,\rho_2,n)$$

edit: por @whuber del ejemplo en el comentario, parece que en el caso general, sólo el trivial de los límites $l = -1, u = 1$ puede ser hecho. Por lo tanto, me gustaría imponer la restricción:

  • $y_1, y_2$ son permutaciones de los números enteros $1 \ldots n$.

4voto

Berek Bryan Puntos 349

Análisis de correlación de Spearman es sólo la correlación producto momento de Pearson entre los rangos de las variables. Shabbychef extra restricción significa que $y_1$ $y_2$ son los mismos que en sus filas y que no hay lazos, por lo que tienen la misma desviación estándar $\sigma_y$ (por ejemplo). Si también reemplazamos x por sus filas, el problema se convierte en el equivalente problema de la correlación producto momento de Pearson.
Por definición de la correlación producto momento de Pearson, $$\begin{align} \rho(x,y_1+y_2) &= \frac{\operatorname{Cov}(x,y_1+y_2)} {\sigma_x \sqrt{\operatorname{Var}(y_1+y_2)}} \\ &= \frac{\operatorname{Cov}(x,y_1) + \operatorname{Cov}(x,y_2)} {\sigma_x \sqrt{\operatorname{Var}(y_1)+\operatorname{Var}(y_2) + 2\operatorname{Cov}(y_1,y_2)}} \\ &= \frac{\rho_1\sigma_x\sigma_y + \rho_2\sigma_x\sigma_y} {\sigma_x \sqrt{2\sigma_y^2 + 2\sigma_y^2\rho(y_1,y_2)}} \\ &= \frac{\rho_1 + \rho_2} {\sqrt{2}\left(1+\rho(y_1,y_2)\right)^{1/2}}. \\ \end{align}$$ Para cualquier conjunto de tres variables, si conocemos dos de sus tres correlaciones podemos poner límites en la tercera correlación (ver, por ejemplo, Vos 2009, o de la fórmula de correlación parcial): $$\rho_1\rho_2 - \sqrt{1-\rho_1^2}\sqrt{1-\rho_2^2} \leq \rho(y_1,y_2) \leq \rho_1\rho_2 + \sqrt{1-\rho_1^2}\sqrt{1-\rho_2^2} $$ Por lo tanto $$\frac{\rho_1 + \rho_2} {\sqrt{2}\left(1+\rho_1\rho_2 + \sqrt{1-\rho_1^2}\sqrt{1-\rho_2^2}\right)^{1/2}} \leq \rho(x,y_1+y_2) \leq \frac{\rho_1 + \rho_2} {\sqrt{2}\left(1+\rho_1\rho_2 - \sqrt{1-\rho_1^2}\sqrt{1-\rho_2^2}\right)^{1/2}} $$ si $\rho_1 + \rho_2 \geq 0$; si $\rho_1 + \rho_2 \le 0$ usted necesita para cambiar los límites a su alrededor.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X