Me encontré con este artículo que utiliza la detección de anomalías en los enlaces para predecir los temas de tendencia, y lo encontré increíblemente intrigante: El artículo es "Descubrir temas emergentes en los flujos sociales mediante la detección de anomalías en los enlaces" .
Me encantaría replicarlo en otro conjunto de datos, pero no estoy lo suficientemente familiarizado con los métodos para saber cómo utilizarlos. Digamos que tengo una serie de instantáneas de la red de nodos a lo largo de un período de seis meses. Los nodos tienen una distribución de grados de cola larga, con la mayoría de ellos con pocas conexiones, pero algunos con muchas. En este periodo de tiempo aparecen nuevos nodos.
¿Cómo podría implementar los cálculos de máxima verosimilitud normalizada descontada secuencialmente que se utilizan en el artículo para detectar enlaces anómalos que creo que podrían ser precursores de una explosión? ¿Hay otros métodos que sean más apropiados?
Lo pregunto tanto en la teoría como en la práctica. Si alguien pudiera indicarme una forma de implementar esto en python o R, sería de gran ayuda.
¿Alguien? Sé que ustedes, los más inteligentes, tienen algunas ideas de partida para una respuesta,
2 votos
Si no te importa relajar la preferencia R/python, ¿puede que este trabajo mío te ayude? goo.gl/l7SLlB Algunas de las ventajas de este método son que no hay que preocuparse por los tipos de características, las normalizaciones, etc.
3 votos
A menos que no entienda bien la pregunta, deberías poder aplicar el método del artículo de la misma forma que lo hicieron los autores del artículo. Si el método no es reproducible a partir del artículo, póngase en contacto con los autores. Los autores también pueden estar dispuestos a proporcionar su código. Si tiene preguntas teóricas o de programación específicas, hágalas por separado.