8 votos

El Mito de Largo Horizonte de Previsibilidad

Recientemente me encontré con un fascinante artículo sobre la predicción de futuros rendimientos del mercado accionario. El autor presenta el siguiente gráfico y cita un R^2 de 0.913. Esto haría que el autor del método de lejos superior a cualquier cosa que he visto sobre el tema (la mayoría sostienen que el mercado de valores es impredecible).

enter image description here

El autor describe su método en gran detalle y proporciona sustancial de la teoría a la copia de seguridad de los resultados. Entonces leí un segundo, criticar el artículo que hace referencia el presente artículo: El Mito de Largo Horizonte de Previsibilidad. Al parecer la gente ha estado cayendo durante esta ilusión por décadas. Por desgracia, yo no entiendo muy bien el papel.

Esto me lleva a las siguientes preguntas:

  • ¿La falsa confianza de las predicciones de largo plazo surgir debido al uso del mismo conjunto de datos para la formación y la validación del modelo? Sería el problema desaparece si la formación y la validación de los datos fueron sacados de independiente, no superposición de períodos de tiempo?
  • Aparte de la validación en el conjunto de entrenamiento, ¿por qué este problema se vuelven más pronunciados a lo largo de largos horizontes?
  • En general, ¿cómo puedo superar este problema cuando los modelos de formación que debe de hacer predicciones a largo plazo?

4voto

Joseph Paterson Puntos 306

Creo que una respuesta simple es que no quieres a la medida R^2 en la escala original de la unicc. Si la previsión es puramente una copia de la última visto unicc valor, el R^2 sería enorme. Ejemplo:

enter image description here

Esto podría ser llamado un falso caso. Estoy obteniendo el valor de 0,96, mientras que esta previsión es totalmente una mierda-ish.

R^2 se va a dar un honesto valor si ha sido medido utilizando estacionaria timeseires, por ejemplo, las diferencias de y y y-hat.

1voto

Chris Novak Puntos 460

El problema no surge porque se utiliza el mismo conjunto de datos de entrenamiento y validación. Esto surge debido a que el efecto de la persistencia de las variables en aumento errores de muestreo y los efectos pequeños en horizontes más largos. Como se indica en el artículo, incluso si usted no puede predecir el futuro del mercado de valores devuelve a partir de la variable de interés, esperamos que $R^2$ así como los coeficientes de regresión a ser aproximadamente proporcional al horizonte de tiempo si las variables son persistentes. Esto es debido a que (pg. 1584):

a) cualquier inusual sacar de la devuelve en el tiempo $t$ va a influir en la rentabilidad para $k$ periodos, donde $k$ es el horizonte de tiempo.

b) una persistente regresor tendrán valores muy parecidos para $t$, $t-1$, $t-2$, .., $t-k$

y así, "El impacto de la inusual sorteo será aproximadamente el $k$ veces más grande que en el largo horizonte de regresión que en el periodo de regresión." En el artículo enlazado, citando a la muy alta $R^2$, el horizonte de tiempo es de diez años, se dispone de datos trimestrales, para un horizonte de tiempo de 10 años (horizonte de tiempo $k = 40$) la inflación en $R^2$ probablemente será muy importante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X