9 votos

¿Cómo puedo transformar los datos de series de tiempo para poder usar técnicas más simples para la predicción de fallas?

Sé que esto es principalmente una de las estadísticas del sitio, así que si estoy off-topic, por favor redirigir mí.

Tengo un sistema con las bombas que a veces se rompen y necesitan ser reemplazados. Me gustaría ser capaz de predecir las fallas, y por lo tanto dar alerta temprana a la gente a la colocación de las bombas. Tengo datos históricos de la bomba de proceso, tales como el caudal, la presión, el líquido de altura, etc.

Tengo sólo una pequeña cantidad de experiencia en el uso de técnicas de aprendizaje de máquina para clasificar datos - básicamente he seguido y hecho los ejercicios de Andrew Ng, de la máquina de aprendizaje del curso en coursera, así como Andrew Conway, las Estadísticas de Uno, y nunca he usado el aprendizaje de máquina para clasificar las series de tiempo. Estoy pensando en cómo puedo transformar mi problema para que yo pueda usar mi conocimiento existente sobre ella. Con mis limitados conocimientos, no voy a obtener un óptimo de predicción, pero espero aprender de esto, y para este problema, cualquier pequeña mejora en la predicción es útil, frente a la espera de los fallos que se producen.

Mi propuesta es convertir a la serie de tiempo en un problema de clasificación. La entrada sería un resumen de una serie de tiempo de la ventana, con el valor de la media, desviación estándar, valores máximos etc. para cada tipo de datos en la ventana. Para la salida, no estoy seguro de lo que podría funcionar mejor. Un enfoque es que la salida sería una clasificación binaria de si la bomba no dentro de un cierto período de tiempo desde el final de la ventana o no. La otra es que el resultado sería el tiempo que queda antes de que la bomba falla, así que no es una clasificación, sino una regresión (en la máquina de aprendizaje de sentido) en su lugar.

¿Crees que este enfoque es probable que los resultados de la producción? Es una cuestión de "depende del dominio y datos históricos". ¿Hay mejor que transforma (de entrada y de salida) que yo no he considerado, o es culpa de la predicción basada en datos de series de tiempo tan diferente de la más estándar de predicción de fallos, que mi tiempo estaría mejor invertido de la lectura en el aprendizaje de máquina con series de tiempo?

6voto

radpin Puntos 121

Es posible que desee ver en el análisis de supervivencia, con el que se puede estimar la función de supervivencia (la probabilidad de que el tiempo de fallo es mayor que en un determinado momento) y la función de riesgo (instantáneos de la probabilidad de que una unidad se producirá un error, dado que no ha experimentado el fracaso hasta el momento). Con la mayoría de los análisis de supervivencia de enfoques que puede entrar invariante en el tiempo y que varían con el tiempo predictores.

Hay una variedad de diferentes análisis de supervivencia de enfoques, incluyendo la semi-paramétrico de riesgos proporcionales de Cox modelo (un.k.una. De regresión de Cox) y los modelos paramétricos. De regresión de Cox no requieren la especificación de la base subyacente función de riesgo, pero usted puede encontrar que usted necesita un modelo paramétrico para capturar adecuadamente los patrones de fallo en los datos. A veces paramétrico acelerado tiempo de falla de los modelos son adecuados, donde la tasa de error aumenta con el tiempo.

Usted podría tratar de comenzar con regresión de Cox, ya que es el más sencillo de utilizar y ver cómo se puede predecir el fracaso en un conjunto de pruebas de exclusión. Sospecho que usted puede tener mejores resultados con algún tipo de análisis de supervivencia, que toma en cuenta explícitamente el tiempo y la censura (bombas que no han fallado aún), que en tratar de convertir esto en un no-tiempo de clasificación basado en problema.

1voto

michael kevin Puntos 9

Basaría mi decisión en la clasificación frente a la regresión basada en la disponibilidad de datos (esto último requiere saber la hora exacta en que ocurrió el fallo, el primero no) y si tener estimaciones del tiempo hasta el fallo es realmente un requisito para Tu problema (mi valor predeterminado sería intentar la clasificación primero).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X