7 votos

Centralidad de Betweenness aplicada al gráfico de libros de Amazon

He hecho una visualización de Amazon productos relacionados. Cada eslabón en la visualización significa que dos productos son a menudo comprado juntos.

Ahora estoy aplicando diversas gráfico de las técnicas de análisis y estoy fascinado por los resultados. El mayor problema, sin embargo, es la traducción de términos científicos para el lenguaje humano (por favor, que me perdonen si suena snobberish).

Por ejemplo, he calculado indegree centralidad de los nodos, y la llamé "Lo que es popular aquí". Después de todo la mayoría de los nodos conectados significa que es más a menudo comprado con todos los demás productos en un gráfico dado.

En la actualidad estoy trabajando en la intermediación del centralismo, y el resultado es bastante interesante de los resultados, a menudo contradictorias grado de centralidad. Pero, ¿cómo interpretar estos resultados? Productos más importantes?

Por ejemplo, los libros de gráfico de el arte de La programación de R tiene los siguientes 3 nodos:

Indegree Centralidad:

  1. El arte de la programación de R - 18 bordes salientes
  2. R libro de cocina (O'Reilly Libros de cocina) - 14 saliente bordes
  3. Haciendo Bayesiano de Análisis de Datos: Un Tutorial con R y ERRORES - 10 saliente bordes

Intermediación Del Centralismo:

  1. El arte de la programación de R - centralidad de valor de 1210
  2. ¿Qué es un valor-p de todos modos? - centralidad de valor de 896
  3. Visualizar Este - centralidad de valor de 784

El mismo gráfico se parece a esto:

enter image description here

6voto

jdelator Puntos 1336

He dedicado una gran cantidad de tiempo buscando en las redes sociales (por ejemplo, redes de actores en Facebook juegos sociales) que intervienen frecuente de cálculo y la comparación de estas tres medidas de Centralidad (grado de centralidad, intermediación centralidad, y la cercanía de centralidad).

Para lo que vale, aquí está mi interpretación de estas medidas se basa en tener en repetidas ocasiones calculada y comparada de ellos para personas que juegan Facebook juegos.

Grado de Centralidad: celebridades, casi siempre los jugadores se ordenan en orden decreciente de grado de centralidad, eran los nombres me reconoció de inmediato (lo cual también podría ser porque yo pase demasiado tiempo leyendo yahoo noticias de celebridades y chismes).

para calcular D/C: esta métrica es sólo un crudo recuento del número de bordes de un nodo dado.

La cercanía del Centralismo: los jugadores con mayor C/C la mayor parte de un grupo diferente que el grupo con el mayor D/C. En general, los jugadores con un alto C/C gastar un montón de tiempo jugando juegos de FB--para el 5% de los jugadores, C/C se correlaciona bastante con total sesiones o total de minutos jugados.

para calcular C/C: (i) calcular los pares mínimos de longitud de ruta de acceso para todos los nodos de la red (usando el de Dijkstra algorithm); (ii) para el Nodo a, calcular la media de longitud de ruta de acceso a todos los otros nodos de la red; (iii) la Cercanía Centralidad es igual a uno por encima de la media de la longitud de la ruta dividido por la longitud máxima de ruta. Los valores de C/C en el rango de 0 a 1, con los números más altos lo que indica menor distancia media

Betweeness Centralidad: una Vez más, me di cuenta de muy poca correlación entre los líderes en este indicador y los máximos goleadores en D/C o C/C.

Que no me sorprende aunque, dado lo diferente es la intuición detrás de esta métrica. B/C captura de dos conceptos relacionados. La primera es la noción de un "límite de la llave"--e..g, es probable que una persona para ser influyente si se unen dos de otra manera distinctd, aparte de sub-redes. "Cuello de botella" es el segundo concepto-por ejemplo, una persona o empresa posicionada a una distribución cuello de botella ejerce el poder únicamente como resultado de esa posición.

Para calcular B/C: (i) repita el primer paso en la Cercanía Centralidad de cálculo anterior; (ii) de la lista de los caminos más cortos calculado en el primer paso, contar el número que incluye el Nodo A.

5voto

Brettski Puntos 5485

La diferencia entre el grado de centralidad y proximidad centralidad - o cualquier otra medida de centralidad - la respuesta es que eres la identificación de diferentes cosas.

En la actualidad estoy trabajando en la intermediación del centralismo, y el resultado es bastante interesante de los resultados, a menudo contradictorias grado de centralidad. Pero, ¿cómo interpretar estos resultados? Producto más importante?

Yo no lo llamaría necesariamente es el producto más importante. A mi parecer, una mejor descripción podría ser "core" productos - aquellos que, independientemente de lo que usted compra, es relativamente fácil acabar en los libros. Mirando a su figura, los tres más populares nodos están todos cerca del centro de la gráfica. Ellos definen los lugares donde, tan pronto como usted se mueve fuera de su sub-campo, tiene un nivel algo más elevado libro que define varios grupos.

Tomar Visualizar Esto, como el más claro ejemplo de ello. Incluso si la gente no conjuntamente comprar libros sobre Tufte teorías del infografía sobre curiosidades, Visualizar Este es un común fundacional libro no muy lejos de cualquiera de los grupos.

Lo mismo es cierto con el p-valor libro. No, en forma conjunta, compra un "Idiotas Guía para una Ciencia Natural" book", un "Popular" Estadísticas de libro y un "Bioestadística" de libro. Pero los tres pueden y terminan comprando Lo que Es un valor-p de todos modos? Su núcleo libro, útil para tres diferentes grupos de lectores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X