Mediante un ataque de fuerza bruta búsqueda exhaustiva, y una recursividad para cada caso, obtengo la siguiente respuesta:
Hay dos equivalentes de las mejores estrategias, a saber:
$$4,5,6,6,7,7,7,8,8,9$$
$$5,6,6,7,7,7,8,8,9,10$$
rendimiento, para el número esperado de rondas,
$$
e=\frac{a}{b} \approx 28.26676327
$$
donde
$$
\begin{align*}
a&=71526610479792733682076713232552201067\\[4pt]
b&=2530413892848114144358747803518976000\\[4pt]
\end{align*}
$$
Observaciones:
Intuitivamente, las multiplicidades de los números seleccionados deben ser proporcionales a la probabilidad de que ocurra en una sola ronda.
Así, por ejemplo, por el simple juego donde usted tira un dado, y llegar a adivinar $6$ números, la selección óptima es $1,2,3,4,5,6$.
Si en cada ronda de rodar dos dados, y llegar a adivinar $36$ números, sospecho que la selección óptima es
$$2,
3,3,
4,4,4,
5,5,5,5,
6,6,6,6,6,
7,7,7,7,7,7,
8,8,8,8,8,
9,9,9,9,
10,10,10,
11,11,
12
$$
Para el juego en cuestión, donde en cada ronda de rodar dos dados, y llegar a adivinar $10$ números, entonces, desde las multiplicidades de los valores seleccionados deben ser números enteros no negativos, no es posible que las multiplicidades para estar en proporción a los asociados probabilidades. Sin embargo, es intuitiva que deben ser aproximadamente en esas proporciones.