39 votos

Detección de anomalías de enlace en la red temporal

Me encontré con este artículo que utiliza la detección de anomalías en los enlaces para predecir los temas de tendencia, y lo encontré increíblemente intrigante: El artículo es "Descubrir temas emergentes en los flujos sociales mediante la detección de anomalías en los enlaces" .

Me encantaría replicarlo en otro conjunto de datos, pero no estoy lo suficientemente familiarizado con los métodos para saber cómo utilizarlos. Digamos que tengo una serie de instantáneas de la red de nodos a lo largo de un período de seis meses. Los nodos tienen una distribución de grados de cola larga, con la mayoría de ellos con pocas conexiones, pero algunos con muchas. En este periodo de tiempo aparecen nuevos nodos.

¿Cómo podría implementar los cálculos de máxima verosimilitud normalizada descontada secuencialmente que se utilizan en el artículo para detectar enlaces anómalos que creo que podrían ser precursores de una explosión? ¿Hay otros métodos que sean más apropiados?

Lo pregunto tanto en la teoría como en la práctica. Si alguien pudiera indicarme una forma de implementar esto en python o R, sería de gran ayuda.

¿Alguien? Sé que ustedes, los más inteligentes, tienen algunas ideas de partida para una respuesta,

2 votos

Si no te importa relajar la preferencia R/python, ¿puede que este trabajo mío te ayude? goo.gl/l7SLlB Algunas de las ventajas de este método son que no hay que preocuparse por los tipos de características, las normalizaciones, etc.

3 votos

A menos que no entienda bien la pregunta, deberías poder aplicar el método del artículo de la misma forma que lo hicieron los autores del artículo. Si el método no es reproducible a partir del artículo, póngase en contacto con los autores. Los autores también pueden estar dispuestos a proporcionar su código. Si tiene preguntas teóricas o de programación específicas, hágalas por separado.

1voto

sdd Puntos 106

En primer lugar, debe elaborar su definición de puntuación de anomalía para un nuevo nodo (véase la sección 3.1, 3.2). Afortunadamente, la correspondencia entre un nuevo post(en su caso) y un nuevo nodo(en tu caso) es casi unívoca, ya que sólo nos interesa el conjunto de nodos(usuarios) con los que el nodo(post) está relacionado.

Así, podemos caracterizar un nuevo nodo por el número de aristas/conexiones k que tiene, y el conjunto V de los otros nodos a los que está conectado. Por tanto, las ecuaciones (1)-(4) podrían escribirse de forma similar. A continuación, se podría utilizar el proceso del Restaurante Chino, tal y como se describe al final de la subsección 3.1., tras introducir un nuevo parámetro $\gamma$ . Ahora, dado que se han obtenido las probabilidades (3), se puede obtener la puntuación de las anomalías de enlace (7).

Pregunte además, si tiene dificultades para seguir los pasos descritos en la subsección 3.4., donde se aplica el SDNML.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X