Tengo la duda de si debo tratar mis datos como una serie temporal o no. Tengo un conjunto de datos sobre motores de avión para el que se me pide que desarrolle un modelo predictivo para la RUL (vida útil restante). Contiene datos sobre 100 vidas útiles completas de motores.
He incluido algunas filas reales del conjunto de datos para ayudar a su interpretación. El conjunto de datos contiene datos de 100 motores. La interpretación de las filas de datos es la siguiente. Por ejemplo, el motor con la identificación del motor 1, estuvo trabajando durante 192 ciclos y luego falló. Por lo tanto, en el ciclo 191 el RUL para el motor con id 1 era igual a 1. En el ciclo 190 el RUL para el motor con id 1 era igual a 2.
1 1 -0.0007 -0.0004 100.0 518.67 641.82 1589.70 1400.60 14.62 21.61 554.36 2388.06 9046.19 1.30 47.47 521.66 2388.02 8138.62 8.4195 0.03 392 2388 100.00 39.06 23.4190
1 2 0.0019 -0.0003 100.0 518.67 642.15 1591.82 1403.14 14.62 21.61 553.75 2388.04 9044.07 1.30 47.49 522.28 2388.07 8131.49 8.4318 0.03 392 2388 100.00 39.00 23.4236
1 3 -0.0043 0.0003 100.0 518.67 642.35 1587.99 1404.20 14.62 21.61 554.26 2388.08 9052.94 1.30 47.27 522.42 2388.03 8133.23 8.4178 0.03 390 2388 100.00 38.95 23.3442
1 4 0.0007 0.0000 100.0 518.67 642.35 1582.79 1401.87 14.62 21.61 554.45 2388.11 9049.48 1.30 47.13 522.86 2388.08 8133.83 8.3682 0.03 392 2388 100.00 38.88 23.3739
1 5 -0.0019 -0.0002 100.0 518.67 642.37 1582.85 1406.22 14.62 21.61 554.00 2388.06 9055.15 1.30 47.28 522.19 2388.04 8133.80 8.4294 0.03 393 2388 100.00 38.90 23.4044
...
1 188 -0.0067 0.0003 100.0 518.67 643.75 1602.38 1422.78 14.62 21.61 551.94 2388.31 9037.91 1.30 48.00 519.79 2388.23 8117.69 8.5207 0.03 396 2388 100.00 38.51 22.9588
1 189 -0.0006 0.0002 100.0 518.67 644.18 1596.17 1428.01 14.62 21.61 550.70 2388.27 9044.55 1.30 48.08 519.58 2388.33 8117.51 8.5183 0.03 395 2388 100.00 38.48 23.1127
1 190 -0.0027 0.0001 100.0 518.67 643.64 1599.22 1425.95 14.62 21.61 551.29 2388.29 9040.58 1.30 48.33 520.04 2388.35 8112.58 8.5223 0.03 398 2388 100.00 38.49 23.0675
1 191 -0.0000 -0.0004 100.0 518.67 643.34 1602.36 1425.77 14.62 21.61 550.92 2388.28 9042.76 1.30 48.15 519.57 2388.30 8114.61 8.5174 0.03 394 2388 100.00 38.45 23.1295
1 192 0.0009 -0.0000 100.0 518.67 643.54 1601.41 1427.20 14.62 21.61 551.25 2388.32 9033.22 1.30 48.25 520.08 2388.32 8110.93 8.5113 0.03 396 2388 100.00 38.48 22.9649
Obviamente, para este conjunto de datos es muy fácil obtener el RUL; simplemente se puede contar hacia atrás desde el último ciclo. Sin embargo, hay que tener en cuenta que estos datos sólo contienen datos de la vida útil completa, es decir, motores que ya han sido retirados de la circulación. Los nuevos motores para los que mi modelo va a predecir no están todavía al final de su vida, y por lo tanto debo hacer un modelo para predecir la RUL. Ahora tengo dos opciones para crear un modelo. La primera es tratar cada fila por separado, lo que da como resultado 20630 filas de diferentes configuraciones de sensores/sensores, a partir de las cuales construyo un modelo para predecir la RUL en motores nuevos (no vistos). La otra opción es tratar los datos como series temporales, ya que las observaciones dentro de un motor (es decir, con el mismo identificador de motor) están claramente relacionadas. Esto llevaría a 100 motores con datos de series temporales.
¿Puede alguien explicarme cuál sería la diferencia entre ambas opciones y cuál es la más favorable en este caso? TLDR; ¿Debo tratar los datos como una serie temporal o no?