Mi conjunto de datos es una lista de elementos y, para cada elemento, una lista de todos los demás elementos con los que este elemento ha coincidido. En efecto, se trata de una matriz de adyacencia para un grafo no dirigido. Estoy buscando algún tipo de prueba para determinar si la agrupación en el gráfico es estadísticamente significativa o si la "aglomeración" que veo es producto del azar.
Creo que la hipótesis nula es que el gráfico se generó de forma aleatoria mediante el siguiente proceso: un usuario ve los artículos de forma aleatoria, pero los selecciona en función de la "popularidad" del producto (por ejemplo, la probabilidad de ver un artículo no se distribuye uniformemente). La hipótesis alternativa sería que el usuario selecciona los artículos para verlos basándose un poco en sus intereses particulares, lo que lleva a una matriz de adyacencia más grumosa de artículos co-ocurrentes.
Ahora creo que sólo necesito una buena estadística para medir esta noción de "aglomeración". Entonces puedo plantear mi prueba de hipótesis como "¿Qué parte de los gráficos aleatorios son más 'grumoso' que el gráfico que estoy probando". Y si ese número es bajo entonces es probable que este gráfico tenga una agrupación útil. (Supongo que la siguiente pregunta es qué tan bajo debe ser este valor antes de que pueda extraer información útil de este gráfico).
Así que en resumen: ¿Existe una prueba estadística para determinar si un grafo no dirigido dado es "más torpe" de lo que sería por pura casualidad?