3 votos

¿Cómo minimizar el ratio de sombra con una red neuronal recurrente LSTM?

He leído algunos artículos sobre el comercio utilizando el aprendizaje por refuerzo recurrente como este . El punto que no entiendo del todo es cómo construir la función de coste/pérdida.

En el artículo, el Sharpe Ratio es una de las opciones que podemos dejar que el RNN minimice. La definición de Sharpe Ratio es $\frac{Average(R_t)}{StandardDeviation(R_t)}$ donde $R_t$ es el rendimiento de la inversión. Así que asumo que esto $R_t$ (retorno) aquí está el recompensa del aprendizaje por refuerzo.

El objetivo del algoritmo es maximizar el coeficiente de solvencia, así que mi pregunta es, ¿cómo debo construir la estructura de la red neuronal/el marco de aprendizaje por refuerzo para implementar este método de ascenso de gradiente para maximizar el coeficiente de solvencia?

En concreto, los datos de entrada son series de precios, ¿cuáles deberían ser los datos de salida? ¿Cuál debe ser la función de coste/pérdida?

1voto

user93019 Puntos 1

Si divides tu conjunto de datos en periodos de inversión (digamos que vas a hacer una apuesta cada 5mins o 1día u otro) me imagino que los datos de salida se derivan de la rentabilidad futura en el siguiente periodo.

En otras palabras, al principio de cada periodo de inversión hay que abrir una posición que se cerrará al final del periodo. Por lo tanto, las pérdidas y ganancias de este periodo (pnl) serán proporcionales a la rentabilidad del activo por el tamaño de su apuesta (puede considerar, por ejemplo, que el tamaño de la apuesta será proporcional a la intensidad de su señal)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X