Tengo datos de series temporales multivariantes del vehículo financiero EURUSD. En estos datos cada variable representa una métrica diferente. Hay ~200.000 filas y ~20 variables. No hay valores NULL para ninguna variable en ninguna fila. Todos los datos son numéricos.
Junto a estos datos, en cada punto temporal tengo los datos univariantes "Beneficio".
Quiero ajustar una función curva para transformar mi conjunto de datos multivariante en un nuevo conjunto de datos univariante que tenga la MÁXIMA correlación con mi variable "Beneficio".
En otras palabras, quiero iterar a través de diferentes transformaciones matemáticas de mi conjunto de datos multivariantes hasta que encuentre la que esté óptimamente correlacionada con mis datos "Profit".
¿Cuál es la mejor manera de hacerlo? Por lo que tengo entendido, un algoritmo genético debería funcionar bien.