1 votos

¿Debo tratar mis datos como series temporales?

Tengo la duda de si debo tratar mis datos como una serie temporal o no. Tengo un conjunto de datos sobre motores de avión para el que se me pide que desarrolle un modelo predictivo para la RUL (vida útil restante). Contiene datos sobre 100 vidas útiles completas de motores.

enter image description here

He incluido algunas filas reales del conjunto de datos para ayudar a su interpretación. El conjunto de datos contiene datos de 100 motores. La interpretación de las filas de datos es la siguiente. Por ejemplo, el motor con la identificación del motor 1, estuvo trabajando durante 192 ciclos y luego falló. Por lo tanto, en el ciclo 191 el RUL para el motor con id 1 era igual a 1. En el ciclo 190 el RUL para el motor con id 1 era igual a 2.

1 1 -0.0007 -0.0004 100.0 518.67 641.82 1589.70 1400.60 14.62 21.61 554.36 2388.06 9046.19 1.30 47.47 521.66 2388.02 8138.62 8.4195 0.03 392 2388 100.00 39.06 23.4190  
1 2 0.0019 -0.0003 100.0 518.67 642.15 1591.82 1403.14 14.62 21.61 553.75 2388.04 9044.07 1.30 47.49 522.28 2388.07 8131.49 8.4318 0.03 392 2388 100.00 39.00 23.4236  
1 3 -0.0043 0.0003 100.0 518.67 642.35 1587.99 1404.20 14.62 21.61 554.26 2388.08 9052.94 1.30 47.27 522.42 2388.03 8133.23 8.4178 0.03 390 2388 100.00 38.95 23.3442  
1 4 0.0007 0.0000 100.0 518.67 642.35 1582.79 1401.87 14.62 21.61 554.45 2388.11 9049.48 1.30 47.13 522.86 2388.08 8133.83 8.3682 0.03 392 2388 100.00 38.88 23.3739  
1 5 -0.0019 -0.0002 100.0 518.67 642.37 1582.85 1406.22 14.62 21.61 554.00 2388.06 9055.15 1.30 47.28 522.19 2388.04 8133.80 8.4294 0.03 393 2388 100.00 38.90 23.4044 

...

1 188 -0.0067 0.0003 100.0 518.67 643.75 1602.38 1422.78 14.62 21.61 551.94 2388.31 9037.91 1.30 48.00 519.79 2388.23 8117.69 8.5207 0.03 396 2388 100.00 38.51 22.9588  
1 189 -0.0006 0.0002 100.0 518.67 644.18 1596.17 1428.01 14.62 21.61 550.70 2388.27 9044.55 1.30 48.08 519.58 2388.33 8117.51 8.5183 0.03 395 2388 100.00 38.48 23.1127  
1 190 -0.0027 0.0001 100.0 518.67 643.64 1599.22 1425.95 14.62 21.61 551.29 2388.29 9040.58 1.30 48.33 520.04 2388.35 8112.58 8.5223 0.03 398 2388 100.00 38.49 23.0675  
1 191 -0.0000 -0.0004 100.0 518.67 643.34 1602.36 1425.77 14.62 21.61 550.92 2388.28 9042.76 1.30 48.15 519.57 2388.30 8114.61 8.5174 0.03 394 2388 100.00 38.45 23.1295  
1 192 0.0009 -0.0000 100.0 518.67 643.54 1601.41 1427.20 14.62 21.61 551.25 2388.32 9033.22 1.30 48.25 520.08 2388.32 8110.93 8.5113 0.03 396 2388 100.00 38.48 22.9649  

Obviamente, para este conjunto de datos es muy fácil obtener el RUL; simplemente se puede contar hacia atrás desde el último ciclo. Sin embargo, hay que tener en cuenta que estos datos sólo contienen datos de la vida útil completa, es decir, motores que ya han sido retirados de la circulación. Los nuevos motores para los que mi modelo va a predecir no están todavía al final de su vida, y por lo tanto debo hacer un modelo para predecir la RUL. Ahora tengo dos opciones para crear un modelo. La primera es tratar cada fila por separado, lo que da como resultado 20630 filas de diferentes configuraciones de sensores/sensores, a partir de las cuales construyo un modelo para predecir la RUL en motores nuevos (no vistos). La otra opción es tratar los datos como series temporales, ya que las observaciones dentro de un motor (es decir, con el mismo identificador de motor) están claramente relacionadas. Esto llevaría a 100 motores con datos de series temporales.

¿Puede alguien explicarme cuál sería la diferencia entre ambas opciones y cuál es la más favorable en este caso? TLDR; ¿Debo tratar los datos como una serie temporal o no?

3voto

usεr11852 Puntos 5514

Este es un estudio longitudinal tratando con " datos de supervivencia ". En primer lugar, le sugeriría que mirara modelo de efectos mixtos Esto permitirá tener en cuenta directamente los efectos de agrupación "dentro del motor". A continuación, sería razonable avanzar con técnicas de modelización conjunta que combinen datos longitudinales y de supervivencia. Los modelos conjuntos mejoran los modelos de supervivencia tradicionales, ya que utilizan las observaciones longitudinales de diversas variables explicativas para predecir el evento final de interés (en este caso, una máquina retirada de la circulación). En definitiva, se trata de un análisis de tiempo a evento (es decir, un análisis de supervivencia). Como vía independiente se podría considerar un modelo de tiempo de fallo acelerado en lugar de un "estándar" Modelo de riesgos proporcionales de Cox utilizado en la mayoría de las técnicas de modelización conjunta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X