1 votos

R entrenar bosque aleatorio para valor predictivo positivo o negativo, no precisión

Estoy trabajando con bosques aleatorios sobre datos financieros (predecir si las acciones suben o bajan).

He descubierto que obtengo mejores resultados si construyo un modelo para "subir" y otro para "bajar".

Cuando construyo los modelos con los mejores conjuntos de características, sólo tengo que manipular los valores de corte de mis probabilidades (por ejemplo, > 0,85 para "creciente").

Sin embargo, ¿hay alguna forma de entrenar a priori a los bosques aleatorios (u otros modelos) para que tengan un valor predictivo positivo (es decir, que sólo predigan "aumento" con una tasa baja de falsos positivos; no me importa la precisión)?

3voto

Mirko Friedenhagen Puntos 304

En una estrategia de optimización de carteras, es una ventaja predecir tanto la magnitud como la probabilidad de subidas y bajadas.

Solución de regresión: Convierta sus precios de series temporales en una medida estacionaria como la diferencia logarítmica o el cambio relativo. El cambio de precios previsto por la RF incorporará tanto la magnitud como la pseudoprobabilidad y, por tanto, una base razonable para clasificar los valores.

Solución binaria: Puedes convertir tus series temporales en eventos de subida y bajada y clasificarlos. Entrene, por ejemplo, 500 árboles y utilice la proporción de votos para clasificar los valores más y menos prometedores. En una situación realista, el mejor ratio de votos sería algo así como 270-230, ya que es realmente difícil predecir bien. No es necesario volver a entrenar para manipular los límites. Simplemente extraiga el ratio de votos e implemente su propia regla (corte, clasificación, etc.).

Puede trazar el ROC de sus predicciones frente al resultado para saber cuál sería un buen límite. La predicción del precio de las acciones es una modelización imperfecta. Le bastará con predecir un pequeño componente de la volatilidad total. No encontrará un subconjunto de predicciones con "bajo falso negativo". Acepte que sólo puede saber muy poco sobre muchos acontecimientos. Las operaciones activas sobre predicciones deben cubrirse con miles de inversiones, para garantizar una alta probabilidad de obtener un beneficio neto positivo.

Hay que prestar atención a la ingeniería de funciones. Si sólo introduce directamente los datos de los días anteriores, obtendrá un modelo mediocre. Necesita construir un modelo sobresaliente para superar sistemáticamente al mercado. Si pudiera tomar un modelo estándar y configurarlo para hacer predicciones seguras, alguien lo habría hecho antes que usted y ya estaría incorporado en los precios del mercado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X