Estoy haciendo algunas simulaciones y necesito una buena heurística para detener la simulación. La simulación continuamente salidas de datos con un costo en el rango [0,1]
. La salida se ve gamma distribuido o posiblemente de Poisson.
Este es un estándar de Hojas de cálculo de Google histograma; todos los valores predeterminados.
Y he aquí un diagrama de dispersión, con el primer intento en el lado izquierdo. Los puntos naranjas son los puntos azules que son también los de menor costo visto hasta ahora. Esos son los que necesito para predecir.
Lo que me gustaría saber es una estimación de la probabilidad de la siguiente simulación produciendo un nuevo costo más bajo, así que puedo hacer un poco informado de la decisión de cuándo parar.
Este conjunto de datos se compone de 11,475 valores. Si desea que los datos reales o gráficos a partir de un conjunto de datos más grande o de otra carrera, hágamelo saber. Esto es parte de un programa que estoy escribiendo como un freetime proyecto; no es parte de una asignación.
EDIT: me imagino que todos los valores son independientes, ya que son ejecutadas en paralelo. Ellos toman la misma entrada, pero el uso de diferentes valores aleatorios.