2 votos

Asesoramiento sobre el algoritmo de detección de anomalías en los datos de atención al cliente

Antecedentes

En el departamento de atención al cliente, cuando los clientes se ponen en contacto con nosotros, clasificamos la interacción en función de los problemas que tienen los clientes. Por ejemplo, el cliente X se puso en contacto con nosotros por un problema de "Pedido no entregado", el cliente Y se puso en contacto con nosotros por "Paquete roto", y el cliente Z se puso en contacto con nosotros por un problema de "Consulta sobre el estado del pedido", etc. Hay unos 100 problemas diferentes que controlamos.

En nuestros informes, los agregamos con los recuentos y los clasificamos según su número. Por ejemplo, los 15 mejores temas en un día, una semana o un mes.

El número de pedidos y la cantidad de quejas están correlacionados, lo que significa que si hay más pedidos, habrá más quejas. Si hay menos pedidos, habrá menos quejas.

Objetivo

El objetivo es detectar el cambio de rango. Por ejemplo, cuando una incidencia pasa del rango 15 al rango 8. Queremos entender cuándo ocurre esto (cuando un problema empieza a afectar a más clientes de los que normalmente lo hacen) y recibir alertas de la subida del problema.

Para ello, me gustaría detectar anomalías en las series temporales. Mi pregunta es ¿qué técnica o algoritmo de aprendizaje automático recomiendan para detectar anomalías en los datos de las series temporales?

1voto

user3780835 Puntos 11

Yo empezaría por hacerlo con datos semanales. Cada categoría, para cada semana sería una instancia independiente. A continuación, el cálculo de las características de interés que usted menciona:

  • número de pedidos
  • número de emisiones
  • clasificación de los problemas
  • etc.

IsolationForest es adecuado para este tipo de características (posible mezcla de categóricas y numéricas).

Dado que las semanas se tratan de forma independiente, el problema se ha convertido de una serie temporal a una serie no temporal. Se trata de una formulación más sencilla, de ahí que sea un buen punto de partida. Para introducir un poco de modelización temporal, se puede añadir el cambio con respecto a la semana anterior para cada característica (en número de emisiones, pedidos, etc.).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X