Supongamos que tengo un gráfico completo de 278 nodos con aristas ponderadas (38503 aristas únicas), y que 58/278 nodos pertenecen a una comunidad específica (es decir, una subred) de nodos, que llamaremos "Comunidad A". Supongamos que las aristas están ponderadas por su asociación con alguna variable de respuesta de interés, y que la hipótesis es que la Comunidad A está particularmente asociada con esta variable de respuesta.
Ahora supongamos que he realizado un paso de selección de características (irrelevante aquí) y he determinado que 32/38503 aristas están significativamente asociadas con esta variable de respuesta. De esas 32 aristas, 17 de ellas contienen exactamente un nodo que pertenece a la Comunidad A.
Pregunta: Me interesa determinar si las aristas que implican un nodo de la Comunidad A se seleccionan como características en una proporción significativamente mayor de lo que esperaríamos por mera casualidad, suponiendo que las aristas se muestrean aleatoriamente.
Gracias de antemano; estoy oxidado con mi combinatoria y la selección de la prueba estadística correcta aquí es un desafío también.