Yo trabajo en una línea de configuración de seguridad. Mi objetivo es detectar si el número de las cuentas bloqueadas por unidad de tiempo es estable o no. Yo he intentado con varios enfoques que a continuación se detalla, pero no estoy satisfecho todavía. Uno de los retos es lidiar con la fluctuación de cantidades de tráfico.
Si el total del tráfico sería constante a lo largo del tiempo, entonces una distribución de Poisson, que podría ayudarles. El bloqueo de cuentas puede ser visto como llegadas. Puesto que el tráfico fluctúa mucho en un día, es difícil probar por minuto o por hora. Pruebas por día podría ser una opción. Los períodos de vacaciones y los fines de semana podría mostrar demasiado baja de la observada los números, pero lo que más me interesa aumenta.
Un cambio de algoritmo de detección como ADWIN también podría ayudar. Si se aplica en el día de totales, la hipótesis sería que la por día el número de las cuentas bloqueadas debe ser estable. Los días con menor tráfico, podría ser un problema, como los fines de semana o en días festivos; o bien, el día después del fin de semana, que muestran un aumento. Una proporción parece más al punto.
Para mantener un seguimiento del tamaño de la muestra, una prueba de chi-cuadrado podría ser de ayuda. Uno podría probar proporciones independientes del tamaño de la muestra mientras las células se llenan con más de 5 observaciones. Las observaciones de la última hora podría ser fácilmente comparado con las observaciones de la última semana desde la prueba de chi-cuadrado toma las proporciones en cuenta. Algunos de bonferroni cosas deben estar en su lugar.
Yo he probado una red neuronal para la línea de base tráfico de predicción, pero este método parece inestable. Básicamente usa un predictor, la varianza de error y un error de valores atípicos de la regla. Este debe ser el estado del arte. La razón por la que no es tan estable es que el tráfico es muy dispar por minuto, aumenta y disminuye de 4 veces parece normal. Podría un promedio de más de horas en lugar de minutos hacer que este modelo funcione mejor?
Alguien tiene más sugerencias?