21 votos

Detección de tiempo serie y anomalía

Me gustaría crear un algoritmo para la detección de una anomalía en las series de tiempo, y tengo la intención de utilizar la agrupación para que.

  • ¿Por qué debo usar una matriz de distancias para la agrupación y no la raw de la serie de tiempo de datos?,

  • Para la detección de la anomalía, voy a utilizar la densidad de clustering basado en un algoritmo DBscan, por tanto habría que trabajar en este caso? Hay una versión en línea para la transmisión de datos?

  • Me gustaría para detectar la anomalía antes de que suceda, así que , con una tendencia algoritmo de detección (ARIMA) ser una buena elección?

12voto

JMW.APRN Puntos 21

Respecto a tu primera pregunta, le recomiendo que lea este famoso artículo (Agrupación de una Serie de Tiempo Subsecuencias es de Sentido) antes de realizar la agrupación en una serie de tiempo. Está claramente escrito y se ilustra muchos de los escollos que se desea evitar.

6voto

Owen Fraser-Green Puntos 642

La detección de anomalías o de Intervención de "Detección" ha sido championd por la C. G. Tiao y otros. Hacer ciencia es la búsqueda de patrones repetidos.Para detectar anomalías es identificar los valores que no siguen los patrones repetidos. Aprendemos de Newton "Quien se conoce a las formas de la Naturaleza será más fácil darse cuenta de sus desviaciones y, por otro lado, quien sabe que su desviaciones va a describir de forma más precisa sus formas". Uno aprende las reglas mediante la observación de las reglas de fallar. Considerar el tiempo de la serie 1,9,1,9,1,9,5,9 . Para identificar la anomalía que uno necesita para tener un patrón. El "5" es una anomalía como "14". Para identificar el patrón de uso de ARIMA y en este caso la "anomalía" se hace evidente. Pruebe diferentes software/enfoques y ver cual sugiere un modelo ARIMA de orden 1,0,0 con un coeficiente de -1.0 . El uso de google/procedimientos de búsqueda para encontrar "automático arima" o "la intervención automática de detección". Usted puede ser decepcionado por las cosas gratis, como podría ser la pena lo que pagas por él. Escrito usted mismo podría ser interesante si tienes un pesado de la serie de tiempo de fondo y un par de años a la basura.Existen serias limitaciones a la distancia de los métodos basados en http://www3.ntu.edu.sg/SCE/pakdd2006/tutorial/chawla_tutorial_pakddslides.pdf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X