Estoy tratando de encontrar la estrategia óptima para un juego donde el objetivo es recoger una serie de elementos donde el beneficio es incierto, pero los pesos establecidos. Cada ronda de recolección de un punto específico en el tiempo, y cada ronda es parcialmente independiente del pasado (creo que los juegos de deportes). Esto es, básicamente, una versión de la mochila problema. (véase el Problema de la Mochila)
Aquí está el problema :
Maximizar: $$\sum _{j=1}^{N}\sum _{j=1}^{\left | G_{i} \right |}p_{ij}x_{ij} +\sum _{j=1}^{\left | G_{s} \right |}p_{sj}x_{sj}$$
Sujeto a: $$
\begin{align}
(\sum _{i=1}^{n}\sum _{j=1}^{\left | G_{i} \right |}w_{ij}x_{ij} +\sum _{j=1}^{\left | G_{s} \right |}w_{sj}x_{sj})&\leq c \\
\sum _{j=1}^{\left | G_{i} \right |}x_{ij} &= 1 \\
\sum _{j=1}^{\left | G_{s} \right |}x_{sj} &= k \\
x_{ij} \in \{0,1\}\\
x_{sj} \in \{0,1\}
\end{align}
$$
Notación:
N el número de elementos
n el número de grupos
c la capacidad de una sola mochila
G = {$G_{1},...,G_{n}$} el conjunto de los grupos de
${\left | G_{i} \right |}$ el número de elementos en el grupo $G_{i}$
${\left | G_{s} \right |}$ el número de elementos en el grupo $G_{s}$ (grupo especial)
$p_{ij}$ la ganancia de punto j de grupo $G_{i}$
$w_{ij}$ el peso del elemento j de grupo $G_{i}$
$p_{sj}$ la ganancia de punto j de grupo $G_{s}$
$w_{sj}$ el peso del elemento j de grupo $G_{s}$
k restricción de grupo $G_{s}$
Así, por ejemplo, digamos que usted tiene 100 elementos por grupo, donde cada elemento tiene un beneficio y un peso. En este caso particular, el beneficio es incierto y por lo tanto debe utilizar la regresión para venir para arriba con una estimación razonable.
Hasta el momento, estoy usando regresión lineal emparejado con un k-NN algoritmo para predecir la ganancia de cada elemento basado en observaciones pasadas. Yo también uso un árbol de decisión alumno para una clasificación entre los artículos que tienen un positivo de ganancias o beneficios negativos (de nuevo, con observaciones anteriores).
Voy a usar GLPK para resolver el problema de la mochila. De hecho, ya he codificado el módulo y su listo para ir. El problema es con la incertidumbre de los beneficios.
Estoy teniendo un momento difícil conceptualizar la incertidumbre y el riesgo. Es allí una manera de separar el elemento opciones de acuerdo al riesgo? Tal vez puedo mirar el histórico de la variación en la ganancia de valor de cada elemento? ¿Hay algún método en particular que sería útil aquí? (Algo parecido a Monte Carlo, etc?)