33 votos

¿Para qué sirve el análisis de series temporales?

¿Para qué sirve el análisis de series temporales?

Hay muchos otros métodos estadísticos, como la regresión y el aprendizaje automático, que tienen casos de uso obvios: la regresión puede proporcionar información sobre la relación entre dos variables, mientras que el aprendizaje automático es estupendo para la predicción.

Pero mientras tanto, no veo para qué sirve el análisis de series temporales. Claro que puedo ajustar un modelo ARIMA y utilizarlo para predecir, pero ¿de qué sirve eso si los intervalos de confianza de esa predicción van a ser enormes? Hay una razón por la que nadie puede predecir el mercado de valores a pesar de ser la industria con más datos de la historia del mundo.

Asimismo, ¿cómo puedo utilizarlo para comprender mejor mi proceso? Claro, puedo trazar el ACF y decir "¡ahí hay cierta dependencia!", pero entonces ¿qué? ¿Qué sentido tiene? Por supuesto que hay dependencia, por eso estás haciendo un análisis de series temporales, para empezar. Ya sabías que había dependencia . Pero, ¿para qué lo vas a utilizar?

14 votos

Hay otros casos de uso, aparte de las finanzas y la economía, en los que funcionan bien.

29 votos

Tampoco se puede predecir el mercado de valores utilizando otros métodos estadísticos y de aprendizaje automático, ¿esto también los hace inútiles?

1 votos

Algunos precios cíclicos son impulsados por la temperatura, como los precios de la vivienda, por lo que se puede ganar dinero utilizando series temporales, y la temperatura en sí misma es una serie temporal cíclica, con noche/día así como variación estacional que son predecibles.

57voto

icelava Puntos 548

Uno de los principales usos es previsión . Llevo más de una década alimentando a mi familia mediante la previsión de cuántas unidades de un determinado producto venderá mañana un supermercado, de modo que pueda pedir suficientes existencias, pero no demasiadas. Hay dinero en esto.

Otros casos de uso de la previsión se dan en publicaciones como el Revista Internacional de Previsión o Previsión . (Revelación completa: soy editor asociado de Previsión .)

Sí, a veces el intervalo de predicción (Supongo que te refieres a los PI, no a los intervalo de confianza s. Hay una diferencia. ) Esto significa simplemente que el proceso es difícil de prever. Entonces hay que mitigarlo. En la previsión de las ventas de los supermercados, esto significa que se necesitan muchas reservas de seguridad. En la previsión de la subida del nivel del mar, esto significa que hay que construir diques más altos. Yo diría que un intervalo de predicción amplio sí proporciona información útil.

Y para todos los casos de uso de la previsión, series temporales El análisis es útil, aunque la previsión es un tema más amplio. A menudo se pueden mejorar las previsiones teniendo en cuenta las dependencias de las series temporales, por lo que es necesario comprender a través del análisis, que es más específico que la simple conociendo las dependencias están ahí.

Además, la gente está interesada en las series temporales aunque no haga previsiones. A los econometristas les gusta detectar puntos de cambio en las series temporales macroeconómicas. O evaluar el impacto de una intervención, como un cambio en las leyes fiscales, sobre el PIB o cualquier otra cosa. Quizá quiera hojear su revista de econometría favorita para inspirarse.

16 votos

+1. También es útil en otros lugares. Hacer un análisis de series temporales sin duda te alertará de eventos (que no conocías) que afectan a un resultado que te interesa. Mis colegas y yo nos quedamos completamente sorprendidos al descubrir que, en general, los análisis químicos de los productos eran ligeramente peores los martes por la mañana. Lo achacamos a un programa de limpieza bien intencionado que tenía algunos puntos débiles. A lo largo del año ahorramos cerca de un millón y mejoramos el ppk del producto de 1,7 a 1,9. Lección aprendida: hacer siempre un análisis rudimentario de las series temporales en cualquier problema enmarcado en la variación.

0 votos

+1. @Stephan Kolassa, tu respuesta pone de manifiesto cómo se utilizan las previsiones en el mundo real, que es mi interpretación de la pregunta del OP. El punto del intervalo de predicción y la longitud (media) es exactamente la información que te interesa para planificar estrategias de mitigación. Si vas a construir diques para evitar que Manhattan se inunde y tu nuevo método de series temporales reduce el intervalo de predicción lo suficiente, puedes reducir el coste de la construcción de los diques utilizando sólo los recursos necesarios. Mutatis mutandis se aplica a su ejemplo de la tienda de comestibles.

13voto

Objetivos en el análisis del ST a partir de las diapositivas de la lección de M. Dettling:

1) Análisis exploratorio: Visualización de las propiedades de la serie

  • gráfico de la serie de tiempo
  • descomposición en tendencia/patrón estacional/error aleatorio
  • correlograma para entender la estructura de dependencia

2) Modelización: Ajuste de un modelo estocástico a los datos que represente y refleje las propiedades más importantes de la serie

  • realizado de forma exploratoria o con conocimientos previos
  • la elección del modelo y la estimación de los parámetros es crucial
  • inferencia: ¿cómo se ajusta el modelo a los datos?

3) Previsión: Predicción de observaciones futuras con medida de la incertidumbre

  • En su mayor parte se basa en un modelo, utiliza la dependencia y los datos del pasado
  • es una extrapolación, por lo que a menudo hay que tomarla con un grano de sal
  • similar a conducir un coche mirando por el espejo retrovisor

4) Control de procesos: La salida de un proceso (físico) define una serie temporal

  • se ajusta un modelo estocástico a los datos observados
  • esto permite comprender tanto la señal como el ruido
  • es posible controlar las fluctuaciones normales/anormales

5) Regresión de series temporales: Modelización de series temporales de respuesta utilizando 1 o más series de entrada Ajuste de este modelo bajo la hipótesis de error i.i.d:

  • conduce a estimaciones no sesgadas, pero...
  • errores estándar a menudo muy erróneos
  • por lo tanto, los intervalos de confianza y las pruebas son engañosas

Sobre el problema del stock marcado:

  • Estas TS son muy volátiles, lo que resulta difícil de modelar.
  • Por ejemplo, un cambio en una ley que afecte a la empresa podría provocar un cambio en el proceso de la ST... ¿cómo podría predecirlo cualquier herramienta estadística?

Sobre la correlación serial:

  • A diferencia de la estadística multivariante, los datos de una serie temporal no suelen ser iid, sino que están correlacionados en serie.
  • Esta información también puede ser útil para detectar que algo no es iid, lo que se supone que es, como por ejemplo un instrumento de laboratorio sucio

1 votos

Yo añadiría la clasificación, por ejemplo, hay numerosas aplicaciones que reconocen tu actividad basándose en el análisis de los datos del acelerómetro de tu teléfono.

0 votos

¡Qué interesante! ¿Cómo se hace esto?

1 votos

Creo que hay muchas formas diferentes. Una forma sería dejar que los usuarios generen datos de entrenamiento etiquetando su actividad. Una vez que los tengas, podrías cortar tus series temporales en intervalos (superpuestos) (por ejemplo, 3 segundos) y entrenar un modelo de aprendizaje automático. Después se podrían clasificar las actividades no etiquetadas.

11voto

Aksakal Puntos 11351

La forma más fácil de responder a su pregunta es entender que, a grandes rasgos, los conjuntos de datos suelen clasificarse como sección transversal , series temporales y panel . Regresión transversal es una herramienta para los conjuntos de datos transversales. Esto es lo que la mayoría de la gente conoce y se refiere a un término regresión . La regresión de series temporales se aplica a veces a las series temporales, pero el análisis de series temporales tiene una amplia gama de herramientas más allá de la regresión.

Un ejemplo de datos transversales es $(x_1,y_1),(x_2,y_3),\dots,(x_n,y_n)$ , donde $x_i,y_i$ son los pesos y las alturas de al azar de los alumnos elegidos en un centro escolar. Cuando una muestra es al azar a menudo podemos realizar una regresión lineal $y\sim x$ y obtener resultados fiables, para quizás predecir la altura $\hat y$ de un estudiante en esta escuela conociendo sólo el peso del estudiante $x$ .

enter image description here

Si la muestra no era aleatoria, la regresión podría no funcionar. Por ejemplo, usted eligió sólo a niñas de primer grado para estimar el modelo, pero tiene que predecir la altura de un varón de 12º grado. Por tanto, la regresión tiene sus propios problemas incluso en la configuración transversal.

Ahora, mira los datos de la serie de tiempo, podría ser $x_t,y_t$ como $(x_1,y_1),(x_2,y_3),\dots,(x_n,y_n)$ , donde $t$ el mes de un año, y $x,y$ siguen siendo el peso y la estatura, pero de un alumno concreto de esta escuela.

enter image description here

Por lo general, la regresión no tiene que funcionar en absoluto. Una de las razones es que los índices $t$ están ordenados. Así que su muestra no es aleatoria, y ya he mencionado que la regresión prefiere una muestra aleatoria para que funcione correctamente. Este es un problema grave. Los datos de las series temporales tienden a ser persistentes, por ejemplo, su altura este mes está altamente correlacionada con su altura el mes siguiente. Para hacer frente a estos problemas se desarrolló el análisis de series temporales, que incluía también la técnica de la regresión, pero tiene que utilizarse de determinadas maneras.

El tercer tipo de conjunto de datos común es un panel, en particular, el de datos longitudinales. En este caso, se pueden obtener varias instantáneas de las variables de peso y altura de un número de estudiantes. Este conjunto de datos puede tener el siguiente aspecto ondas de secciones transversales o un conjunto de series temporales.

enter image description here

Naturalmente, esto puede ser más complicado que los dos tipos anteriores. Aquí utilizamos regresión de paneles y otras técnicas especiales desarrolladas para los paneles.

Resumiendo, la razón por la que la regresión de series temporales se considera una herramienta distinta a la regresión transversal es que las series temporales presentan desafíos únicos cuando se trata de los supuestos de independencia de la técnica de regresión. En particular, debido al hecho de que, a diferencia del análisis transversal, el orden de las observaciones importa, suele dar lugar a todo tipo de estructuras de correlación y dependencia, que a veces pueden invalidar la aplicación de las técnicas de regresión. Hay que lidiar con la dependencia, y eso es precisamente lo que se le da bien al análisis de series temporales.

Previsibilidad de los precios de los activos

Además, estás repitiendo una idea errónea sobre los mercados de valores y los precios de los activos en general, que no se pueden predecir. Esta afirmación es demasiado general para ser cierta. Es cierto que no se puede predecir el próximo tick de AAPL de forma fiable. Sin embargo, es un problema muy limitado. Si echas la red más ampliamente, descubrirás un montón de oportunidades para ganar dinero utilizando todo tipo de previsiones (y análisis de series temporales en particular). Arbitraje estadístico es uno de esos campos.

Ahora, la razón por la que los precios de los activos son duro predecir a corto plazo se debe a que un gran componente de los cambios de precios es información nueva. La información verdaderamente nueva que no puede concebirse de forma realista a partir del pasado es, por definición, imposible de predecir. Sin embargo, este es un modelo idealizado, y mucha gente diría que el anomalías que permiten la persistencia del estado. Esto significa que la parte de la variación de los precios puede explicarse por el pasado. En estos casos, el análisis de las series temporales es muy apropiado porque se ocupa precisamente de la persistencia. Se separa lo nuevo de lo viejo, lo nuevo es imposible de predecir, pero lo viejo se arrastra del pasado al futuro. Si se puede explicar aunque sea un poco, en finanzas significa que puede ser capaz de ganar dinero. Siempre y cuando el precio de la estrategia construida sobre dicha previsión cubra los ingresos generados por la misma.

Por último, echa un vistazo a la economía premio nobel en 2013 : "es bastante posible prever el curso general de estos precios en períodos más largos, como los próximos tres a cinco años". Echa un vistazo al nobel de Shiller conferencia En este sentido, analiza la previsibilidad de los precios de los activos.

6voto

Loren Pechtel Puntos 2212

Hay muchos otros métodos estadísticos, como la regresión y el aprendizaje automático, que tienen casos de uso obvios: la regresión puede proporcionar información sobre la relación entre dos variables, mientras que el aprendizaje aprendizaje automático es ideal para la predicción.

Usted responde a su propia pregunta, a continuación: autocorrelación. Las series temporales suelen tenerla, violando un supuesto de la regresión OLS básica. Las técnicas de series temporales tienen los supuestos adecuados para las series temporales.

Los métodos de aprendizaje automático que se ocupan de los datos secuenciales son especializados, como las redes neuronales recurrentes (RNN) o las redes neuronales convolucionales 1-D (CNN), por lo que todavía existen técnicas especializadas para las series temporales.

Pero mientras tanto, no veo para qué sirve el análisis de series temporales. Claro, puedo ajustar un modelo ARIMA y utilizarlo para la predicción, pero ¿qué pero ¿de qué sirve eso cuando los intervalos de confianza de esa predicción van a ser enormes? Hay una razón por la que nadie puede predecir el mercado de valores a pesar de ser la industria con más datos de la historia del mundo.

Los intervalos de confianza (IC) resultantes de una técnica de series temporales serán probablemente mayores que los de una regresión sin series temporales. Esta característica se conoce como precisión. En general, cuando se utiliza una regresión sin series temporales, el IC será más pequeño, pero es incorrecto porque se han violado sus supuestos. Si todo lo que quiere es presentar un gráfico con IC pequeños, invéntelos u omita los IC por completo, pero si quiere unos IC adecuados, utilice las técnicas apropiadas.

El mercado de valores es difícil de predecir debido a su naturaleza. Otras series temporales son mucho más predecibles. Intente utilizar su técnica de aprendizaje automático en el mercado de valores y dudo que tenga más éxito.

Asimismo, ¿cómo puedo utilizarlo para comprender mejor mi proceso? Claro, puedo puedo trazar el ACF y decir "¡ajá! hay cierta dependencia", pero entonces ¿qué? ¿Qué sentido tiene? Por supuesto que hay dependencia, por eso estás haciendo un análisis de series de tiempo para empezar. Usted ya sabía que había había dependencia. Pero, ¿para qué la vas a utilizar?

Para predecir. Para ver la estacionalidad. Para tener una idea de la variabilidad de los datos a lo largo de las diferentes estaciones. Por no hablar de que hay técnicas de series temporales más potentes que el ARIMA de la vieja escuela, como los métodos de espacio de estados. ARIMA no es la mejor técnica para modelar series temporales. (De hecho, el procedimiento ARIMA en su software estadístico de elección probablemente esté utilizando una representación de Espacio de Estado bajo el capó).

6voto

redhqs Puntos 151

El análisis de series temporales también puede contribuir a la detección eficaz de anomalías o valores atípicos en los datos temporales.

Como ejemplo, es posible ajustar un modelo ARIMA y calcular un intervalo de previsión. Dependiendo del caso de uso, el intervalo puede utilizarse para establecer un umbral, dentro del cual se puede decir que el proceso está controlado; si los nuevos datos caen fuera del umbral, se marcan para que se les preste más atención.

Esta entrada del blog tiene una breve y amplia visión de conjunto del análisis de series temporales para la detección de valores atípicos. Para un tratamiento más profundo, investigadores en ebay explican cómo han llevado a cabo la detección de anomalías a escala basándose en el análisis estadístico de los datos de las series temporales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X