En primer lugar, hay que tener en cuenta que no se gana nada con descartar la flecha a menos que se tenga exactamente $3$ puntos. Si tiene menos de $3$ puntos, hay que hacer otro intento, y más vale hacerlo ahora que después.
Para $k=1,2,3,4$ y $s=01,2,3$ , dejemos que $p_k(s)$ sea la probabilidad de que el arquero gane si empieza la ronda $k$ con exactamente $s$ puntos, y toma las decisiones óptimas a partir de entonces.
Primera toma $k = 4$ . Si $s=0$ El arquero necesita $3$ puntos, por lo que elegirá el arco $1$ y ganará con probabilidad $\frac4{10}$ .
Si $s=1$ El arquero necesita $2$ puntos, y no tiene ninguna posibilidad con ninguno de los dos arcos.
Si $s=2$ , elige el arco $2$ y gana con probabilidad $\frac{8}{10}$ .
Si $s= 3$ No utiliza la flecha $4$ y seguro que gana.
Eso es, $$\begin{align} p_4(0) &= \frac25\\ p_4(1) &=0\\ p_4(2)&=\frac45\\ p_4(3)&=1 \end{align}$$
Ahora considere $k=3$ .
Cuando $s=0,$ si el arquero elige el arco $1$ su probabilidad de éxito es $$\frac3{10}\cdot\frac25+\frac3{10}\cdot0+\frac4{10}\cdot1=\frac{13}{25},$$ y si elige inclinarse $2$ la probabilidad de ganar es $$\frac1{10}\cdot\frac25+\frac8{10}\cdot0+\frac1{10}\cdot1=\frac{7}{50}$$ Por lo tanto, elige el arco $1$ y $p_3(0) = \frac{13}{25}$ .
Si $s=1$ , arco $1$ da $$ \frac3{10}\cdot0+\frac3{10}\cdot\frac45+\frac4{10}\cdot0=\frac4{25}$$ y el arco $2$ da $$ \frac1{10}\cdot0+\frac8{10}\cdot\frac45+\frac1{10}\cdot0=\frac{16}{25}$$ En cada caso, el último término proviene del caso en el que ha $4$ puntos agregados, y ninguna posibilidad de ganar. Ignoramos este caso a partir de ahora.
Si $s=2$ Sólo tenemos que considerar los casos en los que puntúa $0$ puntos o $1$ punto. Arco $1$ da $$ \frac3{10}\cdot\frac45+\frac3{10}\cdot1=\frac{27}{50}$$ y el arco $2$ da $$ \frac1{10}\cdot\frac45+\frac8{10}\cdot1=\frac{22}{25}$$
En resumen, $$\begin{align} p_3(0)&=\frac{13}{25}\\ p_3(1)&=\frac{16}{25}\\ p_3(2)&=\frac{22}{25}\\ p_3(3)&=1 \end{align}$$
Ahora el caso $k=2$ .
Cuando $s=0$ , arco $1$ da $$\frac3{10}\cdot\frac{13}{25}+\frac3{10}\cdot\frac{16}{25}+\frac{4}{10}\cdot1=\frac{187}{250}$$ y el arco $2$ da $$\frac1{10}\cdot\frac{13}{25}+\frac8{10}\cdot\frac{16}{25}+\frac1{10}\cdot1=\frac{166}{250}$$
Cuando $s=1$ ,arco $1$ da $$ \frac3{10}\cdot\frac{16}{25}+\frac3{10}\cdot\frac{22}{25}=\frac{57}{125}$$ y el arco $2$ da $$ \frac1{10}\cdot\frac{16}{25}+\frac8{10}\cdot\frac{22}{25}=\frac{96}{125}$$ Cuando $s=2$ , arco $1$ da $$ \frac3{10}\cdot\frac{22}{25}+\frac3{10}\cdot1=\frac{141}{250}$$ y el arco $2$ da $$ \frac1{10}\cdot\frac{22}{25}+\frac8{10}\cdot1=\frac{111}{125}$$ En resumen, $$\begin{align} p_2(0)&=\frac{187}{250}\\ p_2(1)&=\frac{96}{125}\\ p_2(2)&=\frac{111}{125}\\ p_2(3)&=1 \end{align}$$
Ahora para $k=1$ .
Comenzamos la ronda $1$ avec $0$ puntos, por lo que arco $1$ da $$ \frac3{10}\cdot\frac{187}{250}+\frac3{10}\cdot\frac{96}{125}+\frac4{10}\cdot1=\frac{2137}{2500}$$ y el arco $2$ da $$ \frac1{10}\cdot\frac{187}{250}+\frac8{10}\cdot\frac{96}{125}+\frac1{10}\cdot1=\frac{1973}{2500}$$
por lo que el arquero debe utilizar el arco $1$ en la primera ronda, y su probabilidad de ganar es $$\frac{2137}{2500}=\boxed{.8548}$$
Al principio cometí algunos errores en este cálculo, y escribí un pequeño script en python para obtener las probabilidades correctas, de modo que pudiera comprobarlas sobre la marcha.
En caso de que esté interesado, aquí está el guión
from fractions import Fraction
bow1 = {0:Fraction(3,10),
1:Fraction(3,10),
3:Fraction(4,10), 2:0}
bow2 ={0:Fraction(1,10),
1:Fraction(8,10),
3:Fraction(1,10), 2:0}
class pDict(dict):
def __missing__(self, key):
k, s = key
if s == 3:
return 1
if s > 3:
return 0
if k > 4:
return 0
p = pDict()
for k in range(4,0,-1):
for s in range(3):
p[k,s] = max(sum(b[t]*p[k+1,t+s]
for t in range(4))
for b in (bow1,bow2))
print(f'Probability of success {p[1,0]}\n')
for k in range(4,1,-1):
for s in range(3):
print(f'p[{k},s] {p[k,s]}')
print()
Espero que el método sea claro. En principio, dibujamos todo el árbol, mostrando todas las posibilidades. Hay dos tipos de nodos, los nodos cuadrados, por ejemplo donde elegimos un arco, y los nodos redondos donde marcamos $0,\ 1,\text{ or }3$ . Trabajando de abajo hacia arriba, asignamos valores a los nodos de las casillas, que representan la probabilidad de éxito si elegimos el mejor arco. Utilizamos los valores asignados a los nodos cuadrados en un nivel para calcular los valores de los nodos cuadrados en el siguiente nivel superior.
Es difícil dibujar el cuadro. Probablemente lo más fácil sea dibujar una sucesión de árboles, empezando por los redondos $4$ y que va hacia atrás.