Yo estaba viendo la ciencia aplicada explorar el espacio de estado mientras que la toma de cookies en este video https://youtu.be/8YEdHjGMeho. Él fue la creación de todo manualmente, y parece que fue la búsqueda de un 10 dimensiones de la receta de espacio.
Estaba pensando que es muy difícil dar con una constante de puntuación para cada cookie gusto, pero usted puede fácilmente rango de pares de cookies probado.
¿Cómo podría alguien optimizar hyper-parámetros en un marco donde no hay ninguna puntuación global de la función. Sólo un ruidoso rango entre dos puntos. Creo que es justo asumir elección es transitivo y que su sabor no cambia mucho a lo largo de este experimento.
Parece que su función puede ejecutar en lotes de 20 a 30 puntos en un tiempo, pero hay una muy alta latencia para cada lote.