Existen $m$ bolas en la casilla A y $n$ bolas en la caja B. Por cada vez, sacas una bola de cualquiera de las dos cajas con la misma probabilidad. (es decir, 1/2) Dejas de sacar cuando hay una caja vacía (es decir, paras en cuanto una caja se queda vacía).
a) ¿cuál es la expectativa del número de bolas en la caja no vacía cuando se deja de extraer?
b) si $m=n=c$ cuál es la tendencia la expectativa va cuando el $c$ ¿llega hasta el infinito?
Si a) es demasiado complejo, responder simplemente a b) también ayuda.
TEN EN CUENTA QUE SE TRATA DE UN PROBLEMA MATEMÁTICO PERO NO DE PROGRAMACIÓN.
Estos son los resultados de la simulación mediante programación dinámica, como se indica a continuación.
c=1 resultado=1.0
c=4 resultado=2.1875
c=16 resultado=4.478397890925407
c=36 resultado=6.7468086213781735
c=81 resultado=10.139752756675115
c=100 resultado=11,26969580185129
c=225 result=16.916286965946945
c=400 result=22.560532075769885
c=625 resultado=28.203837846306
c=961 result=34.975204560067226
Así que realmente parece que va a $\sqrt{N}$ como $c$ llega hasta el infinito. ¿Alguien tiene idea de por qué crece así?