1 votos

Determinar si un nodo de una comunidad específica aparece con más frecuencia que por azar

Supongamos que tengo un gráfico completo de 278 nodos con aristas ponderadas (38503 aristas únicas), y que 58/278 nodos pertenecen a una comunidad específica (es decir, una subred) de nodos, que llamaremos "Comunidad A". Supongamos que las aristas están ponderadas por su asociación con alguna variable de respuesta de interés, y que la hipótesis es que la Comunidad A está particularmente asociada con esta variable de respuesta.

Ahora supongamos que he realizado un paso de selección de características (irrelevante aquí) y he determinado que 32/38503 aristas están significativamente asociadas con esta variable de respuesta. De esas 32 aristas, 17 de ellas contienen exactamente un nodo que pertenece a la Comunidad A.

Pregunta: Me interesa determinar si las aristas que implican un nodo de la Comunidad A se seleccionan como características en una proporción significativamente mayor de lo que esperaríamos por mera casualidad, suponiendo que las aristas se muestrean aleatoriamente.

Gracias de antemano; estoy oxidado con mi combinatoria y la selección de la prueba estadística correcta aquí es un desafío también.

1voto

Stacker Puntos 6

Hay 58 nodos en la comunidad A, por lo que hay 278-58 nodos que no están en la comunidad A. El número de aristas con exactamente 1 nodo de la comunidad A es entonces 58(220)=12760. La probabilidad insesgada de que la arista contenga exactamente 1 nodo de la comunidad A es entonces 12760/38503.

Obtuvimos 17/32 bordes de la comunidad A. Para comparar las dos proporciones, haz una prueba z de proporciones de una muestra.

En R, es lo siguiente,

> prop.test(17, 32, 12760/38503)

    1-sample proportions test with continuity correction

data:  17 out of 32, null probability 12760/38503
X-squared = 4.9013, df = 1, p-value = 0.02684
alternative hypothesis: true p is not equal to 0.3314027
95 percent confidence interval:
 0.3503305 0.7048986
sample estimates:
      p 
0.53125 

La conclusión indica que la proporción es diferente de la probabilidad nula.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X