Yo personalmente no llamaría a esto "limpieza de datos". Creo que de la limpieza de los datos más en el sentido de edición de datos - limpieza de las inconsistencias en el conjunto de datos (por ejemplo, un registro que ha informado de la edad de 1000, o una persona de entre 4 es un padre soltero, etc.).
La presencia de un efecto real en los datos no es "desordenado" (al contrario, la presencia de efectos reales haría rico) - a pesar de que puede hacer su tarea matemática más involucrados. Yo sugeriría que los datos se "limpian" de esta manera, si es la única forma viable de obtener una predicción. Si hay una forma factible de que no tire de la información, a continuación, utilizar ese.
Suena como usted puede beneficiarse de algún tipo de análisis cíclico, dado que dicen que este efecto se produce alrededor periódicamente (como una especie de "ciclo de negocios").
Desde mi punto de vista, si usted está buscando en previsión de algo, entonces la eliminación de un auténtico efecto de que la fuente sólo puede hacer sus predicciones peor. Esto es debido a que han "tirado" la información que usted desea predecir!
El otro punto es que puede ser difícil determinar cuánto de un conjunto de muertes fueron a causa de la epidemia, y cuánto fue causado por el ordinario de las fluctuaciones.
En la terminología estadística, la epidemia parece que, desde su punto de vista, es una "molestia" para lo que en realidad se desea analizar. Así que usted no está particularmente interesado en ella, sino que necesita de alguna manera, cuenta en su análisis. Una "rápida y sucia" manera de hacer esto en un ajuste de regresión es incluir un indicador de la epidemia en los periodos informativos como un regresor variable. Esto le dará una estimación media de los efectos de las epidemias (e implícitamente se asume que el efecto es el mismo para cada una epidemia). Sin embargo, este método sólo funciona para describir el efecto, porque en los pronósticos, su regresión de la variable es desconocida (no sé cuál de los períodos en el futuro va a ser una epidemia).
Otra manera de explicar la epidemia es el uso de un modelo de mezcla de dos componentes: un modelo para la epidemia parte y un modelo para el "ordinario". El modelo a continuación, procede en dos pasos: 1) clasificar un período de epidemia o normal, a continuación, 2) aplicar el modelo a la que se clasificó.