La forma más fácil de responder a su pregunta es entender que, a grandes rasgos, los conjuntos de datos suelen clasificarse como sección transversal , series temporales y panel . Regresión transversal es una herramienta para los conjuntos de datos transversales. Esto es lo que la mayoría de la gente conoce y se refiere a un término regresión . La regresión de series temporales se aplica a veces a las series temporales, pero el análisis de series temporales tiene una amplia gama de herramientas más allá de la regresión.
Un ejemplo de datos transversales es $(x_1,y_1),(x_2,y_3),\dots,(x_n,y_n)$ , donde $x_i,y_i$ son los pesos y las alturas de al azar de los alumnos elegidos en un centro escolar. Cuando una muestra es al azar a menudo podemos realizar una regresión lineal $y\sim x$ y obtener resultados fiables, para quizás predecir la altura $\hat y$ de un estudiante en esta escuela conociendo sólo el peso del estudiante $x$ .
Si la muestra no era aleatoria, la regresión podría no funcionar. Por ejemplo, usted eligió sólo a niñas de primer grado para estimar el modelo, pero tiene que predecir la altura de un varón de 12º grado. Por tanto, la regresión tiene sus propios problemas incluso en la configuración transversal.
Ahora, mira los datos de la serie de tiempo, podría ser $x_t,y_t$ como $(x_1,y_1),(x_2,y_3),\dots,(x_n,y_n)$ , donde $t$ el mes de un año, y $x,y$ siguen siendo el peso y la estatura, pero de un alumno concreto de esta escuela.
Por lo general, la regresión no tiene que funcionar en absoluto. Una de las razones es que los índices $t$ están ordenados. Así que su muestra no es aleatoria, y ya he mencionado que la regresión prefiere una muestra aleatoria para que funcione correctamente. Este es un problema grave. Los datos de las series temporales tienden a ser persistentes, por ejemplo, su altura este mes está altamente correlacionada con su altura el mes siguiente. Para hacer frente a estos problemas se desarrolló el análisis de series temporales, que incluía también la técnica de la regresión, pero tiene que utilizarse de determinadas maneras.
El tercer tipo de conjunto de datos común es un panel, en particular, el de datos longitudinales. En este caso, se pueden obtener varias instantáneas de las variables de peso y altura de un número de estudiantes. Este conjunto de datos puede tener el siguiente aspecto ondas de secciones transversales o un conjunto de series temporales.
Naturalmente, esto puede ser más complicado que los dos tipos anteriores. Aquí utilizamos regresión de paneles y otras técnicas especiales desarrolladas para los paneles.
Resumiendo, la razón por la que la regresión de series temporales se considera una herramienta distinta a la regresión transversal es que las series temporales presentan desafíos únicos cuando se trata de los supuestos de independencia de la técnica de regresión. En particular, debido al hecho de que, a diferencia del análisis transversal, el orden de las observaciones importa, suele dar lugar a todo tipo de estructuras de correlación y dependencia, que a veces pueden invalidar la aplicación de las técnicas de regresión. Hay que lidiar con la dependencia, y eso es precisamente lo que se le da bien al análisis de series temporales.
Previsibilidad de los precios de los activos
Además, estás repitiendo una idea errónea sobre los mercados de valores y los precios de los activos en general, que no se pueden predecir. Esta afirmación es demasiado general para ser cierta. Es cierto que no se puede predecir el próximo tick de AAPL de forma fiable. Sin embargo, es un problema muy limitado. Si echas la red más ampliamente, descubrirás un montón de oportunidades para ganar dinero utilizando todo tipo de previsiones (y análisis de series temporales en particular). Arbitraje estadístico es uno de esos campos.
Ahora, la razón por la que los precios de los activos son duro predecir a corto plazo se debe a que un gran componente de los cambios de precios es información nueva. La información verdaderamente nueva que no puede concebirse de forma realista a partir del pasado es, por definición, imposible de predecir. Sin embargo, este es un modelo idealizado, y mucha gente diría que el anomalías que permiten la persistencia del estado. Esto significa que la parte de la variación de los precios puede explicarse por el pasado. En estos casos, el análisis de las series temporales es muy apropiado porque se ocupa precisamente de la persistencia. Se separa lo nuevo de lo viejo, lo nuevo es imposible de predecir, pero lo viejo se arrastra del pasado al futuro. Si se puede explicar aunque sea un poco, en finanzas significa que puede ser capaz de ganar dinero. Siempre y cuando el precio de la estrategia construida sobre dicha previsión cubra los ingresos generados por la misma.
Por último, echa un vistazo a la economía premio nobel en 2013 : "es bastante posible prever el curso general de estos precios en períodos más largos, como los próximos tres a cinco años". Echa un vistazo al nobel de Shiller conferencia En este sentido, analiza la previsibilidad de los precios de los activos.
14 votos
Hay otros casos de uso, aparte de las finanzas y la economía, en los que funcionan bien.
29 votos
Tampoco se puede predecir el mercado de valores utilizando otros métodos estadísticos y de aprendizaje automático, ¿esto también los hace inútiles?
1 votos
Algunos precios cíclicos son impulsados por la temperatura, como los precios de la vivienda, por lo que se puede ganar dinero utilizando series temporales, y la temperatura en sí misma es una serie temporal cíclica, con noche/día así como variación estacional que son predecibles.
16 votos
Parece insinuar que ARIMA no es una forma de regresión. Lo es.
1 votos
En su forma más sencilla, el análisis de series temporales es un tipo de regresión en el que se permite explícitamente que los términos de error consecutivos dependan unos de otros, por lo que no es más que una regresión con otra función de coste. Incluso en el caso de modelos lineales relativamente sencillos, esto hace que la optimización de la función de coste sea mucho más difícil que en el caso de los mínimos cuadrados. En teoría, se podría utilizar cualquier tipo de modelo que se desee (por ejemplo, un regresor de red neuronal) con esta función de coste, aunque presumiblemente la optimización sería un reto aún más formidable
11 votos
Creo que es una buena pregunta, aunque la respuesta parezca obvia para los expertos.
0 votos
Estoy con @gung aquí.
7 votos
Siento discrepar con @gung y otros, porque el menor esfuerzo de investigación lo respondería.
1 votos
Hay al menos tres características del análisis de series temporales a las que hay que prestar especial atención: la estacionalidad, la autocorrelación y el hecho de que el futuro dependa del pasado y no al revés. El tratamiento de estas cuestiones forma parte de la cuestión.
2 votos
El análisis de series temporales, en su forma más débil, parece basarse en la idea de que se puede entender un sistema con sólo mirar sus resultados. Este enfoque no parece haber tenido mucho éxito en la ciencia, la ingeniería, la medicina o incluso la política.
0 votos
@NickCox, deberías ver lo que la gente del análisis técnico hacer con ellos . Te dejará boquiabierto
0 votos
Regresión es un análisis de series temporales. Cualquier análisis que utilice datos de series temporales incluye el aprendizaje automático. Sin embargo, encontrará que se presta mucha atención a los métodos de datos correlacionados, especialmente a los que se refieren a pocos grupos (incluso sólo uno) que tienen series largas.
3 votos
Estoy de acuerdo con @gung - aquí hay respuestas de colaboradores cuya formación es muy diferente a la mía, y para ellos el "punto obvio" de las series temporales es algo no sólo diferente de lo que yo habría enumerado en mi lista de las cinco razones para hacer series temporales, ¡sino que ni siquiera había oído hablar de ellas ni había pensado en ellas! Ha sido muy educativo. (Los libros suelen presentar el análisis de las series temporales como un medio para alcanzar un fin concreto y específico; el OP ha investigado claramente a uso de series temporales, y mejor que eso, también señaló sus severas limitaciones para ese fin - no quisiera ser demasiado duro con su esfuerzo de investigación)