Supongamos que tenemos un vector binario de longitud 1000 en el que podemos activar o desactivar cada elemento. Cada uno de los $2^{1000}$ diferentes escenarios revela una recompensa. El objetivo es encontrar la configuración con la máxima recompensa en un tiempo finito.
Obviamente, una búsqueda aleatoria será completamente inútil porque el espacio a explorar es sencillamente demasiado grande. ¿Existen técnicas de optimización (bayesianas o no bayesianas) que muestren un buen rendimiento empírico en este tipo de problemas? Agradecería que alguien me indicara alguna bibliografía al respecto.