He hecho una visualización de Amazon productos relacionados. Cada eslabón en la visualización significa que dos productos son a menudo comprado juntos.
Ahora estoy aplicando diversas gráfico de las técnicas de análisis y estoy fascinado por los resultados. El mayor problema, sin embargo, es la traducción de términos científicos para el lenguaje humano (por favor, que me perdonen si suena snobberish).
Por ejemplo, he calculado indegree centralidad de los nodos, y la llamé "Lo que es popular aquí". Después de todo la mayoría de los nodos conectados significa que es más a menudo comprado con todos los demás productos en un gráfico dado.
En la actualidad estoy trabajando en la intermediación del centralismo, y el resultado es bastante interesante de los resultados, a menudo contradictorias grado de centralidad. Pero, ¿cómo interpretar estos resultados? Productos más importantes?
Por ejemplo, los libros de gráfico de el arte de La programación de R tiene los siguientes 3 nodos:
Indegree Centralidad:
- El arte de la programación de R - 18 bordes salientes
- R libro de cocina (O'Reilly Libros de cocina) - 14 saliente bordes
- Haciendo Bayesiano de Análisis de Datos: Un Tutorial con R y ERRORES - 10 saliente bordes
Intermediación Del Centralismo:
- El arte de la programación de R - centralidad de valor de 1210
- ¿Qué es un valor-p de todos modos? - centralidad de valor de 896
- Visualizar Este - centralidad de valor de 784
El mismo gráfico se parece a esto: