5 votos

Detectar eventos periódicos en los datos

Tengo una colección de transacciones con tarjeta, cada una con una fecha, un importe, un identificador de tarjeta y un comerciante. Quiero determinar si una tarjeta está realizando pagos periódicos a un determinado comercio. El problema es que el periodo es desconocido, puede haber alguna variación (es decir, diferentes días en un mes, a veces la factura se paga con unos días de retraso) y puede haber eventos intercalados que no coincidan con el ciclo.

En última instancia quiero extraer el subconjunto de transacciones que se consideran periódicas (si es que existe)

Creo que, para empezar, sólo utilizaría la fecha frente a los pagos binarios (es decir, si se ha efectuado un pago o no, sin tener en cuenta el importe).

¿Podría alguien indicarme algunos enfoques al respecto? Mi formación no es estadística y hasta ahora mi búsqueda en Google ha resultado inadecuada. Gracias

0 votos

Debería probar el análisis espectral para identificar periodos en sus datos por encima del ruido blanco, su fondo no es especialmente difícil. SAS tiene una gran implementación del mismo.

0 votos

¿Por qué no envías tus datos en un archivo Excel, indicando la fecha de inicio y, en su caso, el país de origen y voy a tratar de ayudarte?

0 votos

Parece que has construido una buena y creativa solución ..... ¡Gran trabajo!

3voto

Owen Fraser-Green Puntos 642

Yo no recomendaría convertir los datos en 0/1 . He tenido mucha experiencia con datos de pagos bancarios diarios, acceso a cajeros automáticos, depósitos, etc. Si los pagos son sistemáticos/regulares a un día concreto del mes, entonces es bastante sencillo identificar estos patrones. Sin embargo, si los datos no son sistemáticos, yo sugeriría un enfoque en dos fases. En la primera etapa se identificarían los impulsos y se registrarían la fecha y la magnitud del impulso. La segunda etapa requeriría un enfoque basado en reglas en el que se tomarían los impulsos y los datos asociados a ellos y se agruparían/analizarían de acuerdo con sus especificaciones, es decir, las cosas con 1 día de diferencia o 2 días de diferencia regular deberían considerarse/clasificarse como parte de la misma familia. Otra forma es utilizar el tamaño del pulso/valor inusual como cualificado para la agrupación. La detección de actividad inusual requiere un modelo que incorpore la rutina, por ejemplo, los efectos del día de la semana, los efectos de las vacaciones, los efectos semanales, los efectos mensuales y cualquier estructura autocorrelativa evidenciada en sus datos. Es posible que haya que adaptar o mejorar los programas informáticos disponibles en el mercado para abordar esta cuestión potencialmente espinosa, pero esto es típico de cómo se desarrollan los programas informáticos como resultado de su insuficiencia actual documentada.

0 votos

Tengo curiosidad por dos cuestiones: 1) cómo detectar cíclico en lugar de estacional ( otexts.org/fpp/6/1 ); 2) cómo extracto subconjuntos de datos con comportamiento cíclico. He mirado algunos paquetes de R, pero no he visto ejemplos claros.

1 votos

Detectar los pulsos estacionales es bastante fácil utilizando unc.edu/~jbhill/tsay.pdf . Detectar qué días del mes son estadísticamente significativos/importantes es una característica exclusiva de AUTOBOX autobox.com/cms que he ayudado a desarrollar. Si desea hablar más sobre esto, quizá pueda ponerse en contacto conmigo fuera de línea e intentaré ayudarle.

0 votos

Gracias por la rápida respuesta y los buenos enlaces (aunque mi interés actual es el ecosistema R :). Revisaré la información y haré todo lo posible por entenderla. En cuanto a lo de hablar, agradezco mucho tu amable oferta y la tendré en cuenta para el futuro. Por el momento, no me siento lo suficientemente competente en series temporales (y en estadística, en general) como para conversar con expertos. Actualmente estoy ocupado preparando la defensa de mi tesis, por lo que no dispongo de mucho tiempo para la autoformación en estadística. No obstante, espero poder continuar en el futuro. De nuevo, agradezco mucho sus amables palabras.

0voto

voon Puntos 433

Deberías probar el análisis espectral para identificar periodos en tus datos por encima del ruido blanco, su fondo no es especialmente difícil. SAS tiene una gran implementación del mismo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X