3 votos

¿Cómo calcular el coeficiente de correlación de Pearson para este pequeño gráfico?

Dejemos que $A$ denotan un grafo dirigido y ponderado, donde los pesos en las filas son los grados de salida, y los pesos en las columnas son los grados de entrada:

$A$ = \begin{bmatrix} 0 & 0 & 0 \\ 1 & 0 & 2 \\ 1 & 0 & 0 \end{bmatrix}

enter image description here

Aquí está el fórmula que me gustaría utilizar (la notación no me queda clara):

$$r= \frac{\sum_{jk}(jk(e(j,k)-q(j)q(k)))}{\sigma_{q}^2}$$

Según mi función en R (igraph), $r = - 0.5$ .

Mi problema es que no entiendo qué denotan las variables en esta fórmula. Leí el libro Redes de Newman, y proporcionaba la misma información "minimalista" sobre la ecuación.

Intenté calcular la correlación por enlaces o por la suma de los grados de entrada y salida de los nodos, sin embargo, mis resultados fueron diferentes. Sea $x$ sea el vector de bordes de salida, y $y$ el vector de los bordes de entrada: $x=(1,1,0), y=(0,0,2)$ entonces $corr(x,y)=-1$ .

¿Podría alguien mostrarme una solución paso a paso, por favor?

1voto

user90997 Puntos 1

La fórmula de Newman que se menciona en el PO fue concebida originalmente para grafos no dirigidos (como se indica correctamente en los comentarios). Un concepto clave en esta fórmula es el del "grado restante" de un nodo, es decir, el número de aristas que conectan el nodo, después de excluir la arista por la que llegamos. La fórmula se puede generalizar al caso de un grafo dirigido sustituyendo el denominador $\sigma_q^2$ (es decir, la varianza del grado restante) con $\sigma_{in}^2 \sigma_{out}^2\,$ es decir, el producto de las SD de los grados restantes de entrada y salida de los nodos en la cabeza y la cola de la arista, respectivamente. Esta generalización conduce a la siguiente fórmula para calcular la asortatividad en los grafos dirigidos:

$$r=\displaystyle \frac{\sum_{jk} \,jk \left(e_{jk}-q_jq_k \right)}{\sigma_i^2 \sigma_o^2 }$$

donde $e_{jk}$ es la distribución de probabilidad conjunta de los grados restantes de los dos nodos en cada extremo de cada arista (asimétrica en el caso del grafo dirigido), y donde $q_j$ y $q_k$ se refieren a la distribución de probabilidad del grado restante en cada uno de los dos nodos, considerados por separado. Dado que $jk \, e_{jk}$ y $jk \, q_jq_k$ corresponden a $E(jk)$ y $E(j)E(k)\,\,$ respectivamente, la fórmula se parece estrictamente a la del coeficiente de correlación de Pearson estándar para una muestra que incluye dos variables $x,y\,$ :

$${\displaystyle r_{xy}={\frac {E( x_{i}y_{i})-{\bar {x}}{\bar {y}}}{s_{x}s_{y}}}}$$

donde $s_x$ y $s_y$ son las correspondientes DE de la muestra. Esto explica por qué la asortatividad puede considerarse igual al coeficiente de correlación de Pearson de los grados en los extremos de una arista.

Ahora bien, hay que señalar que el aplicación estándar de R para la asortatividad (igraph) no se desarrolló inicialmente para grafos no ponderados, por lo que por defecto calcula la asortatividad ignorando los pesos. Por lo tanto, considerando el gráfico mostrado en el PO y definiendo $RD(a,b)\,$ los grados restantes de los dos nodos de una arista (donde $a$ y $b$ cuantifican los grados de salida restantes del nodo en la cola de la arista y los grados de entrada restantes del nodo en la cabeza de la arista, respectivamente), la aplicación R considera la arista $1$ como $RD(1,1)\,\,$ (conecta un nodo con un grado de salida restante con otro nodo con un grado de entrada restante). Por consideraciones similares, la aplicación R considera la arista $2$ como $RD(1,0)\,\,$ y el borde $3$ como $RD(0,1)\,\,$ . Esto conduce finalmente a los vectores $x(1,1,0)\,\,$ y $y=(1,0,1)\,\,$ cuya correlación es $-\frac{1}{2}\,$ .

Por último, hay que tener en cuenta que existen aplicaciones en R que son capaces de calcular la asortatividad para redes ponderadas. Estas aplicaciones sustituyen el recuento de grados por la fuerza de grados. Se puede encontrar una buena discusión sobre este tema aquí .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X