A largo plazo, el sistema alcanzará un estado estacionario en el que cada paso hace girar la distribución de probabilidad en una urna para que siga siendo la misma en relación con la urna que se visitará a continuación (la "urna actual"). Así, habrá una distribución estacionaria sobre los posibles patrones de bolas en relación con la urna actual. Esta distribución puede determinarse explícitamente, e implica la recursión que encontró eBusiness.
Al analizar los patrones de bolas, podemos ignorar la última urna (en el sentido de las agujas del reloj desde la urna actual), que era la urna actual del paso anterior, ya que siempre contiene una bola. Sólo consideraré los estados con una bola en la última urna, y no incluiré esa bola en las representaciones de los patrones de bolas en lo que sigue.
Para cada patrón de bolas, comenzando por la urna actual y moviéndose en el sentido de las agujas del reloj, forme un "producto de huecos" que contenga un "factor de huecos" por cada urna vacía ("hueco"), siendo el factor de huecos el número de bolas que aún no se han encontrado. Por ejemplo, para $N=8$ , $M=4$ el patrón *--*-*-
(donde "*" representa una bola y "-" representa un hueco; recuerde que la última bola no se muestra) se asocia con el producto $3\cdot3\cdot2\cdot1$ . La distribución estacionaria sobre los patrones viene dada por estos productos, normalizados por su suma.
Para demostrar esto, tenemos que mostrar que el proceso deja invariante esta distribución; es decir, para cada patrón $i$ Debemos tener
$$\sum_jp_ip_{ij}=p_j\;,$$
donde $p_i$ es la probabilidad estacionaria y $p_{ij}$ es la probabilidad de transición del estado $i$ al estado $j$ . Podemos multiplicar esta ecuación por la constante de normalización (la suma de los productos de brecha) para expresarla en términos de los productos de brecha en lugar de las probabilidades normalizadas. Demostraré que esto se cumple por inducción sobre $M+N$ .
El caso inicial $M=1$ es fácil de comprobar: Sólo hay un estado posible, en el que la bola única está en la última urna, y por lo tanto su probabilidad sale correctamente como $1$ . Desde $N\ge M$ Esto fundamenta la inducción.
En general $M$ y $N$ Podemos distinguir dos tipos de patrones, dependiendo de si la urna anterior a la última (la "penúltima urna"), que era la urna actual hace dos pasos (en el "penúltimo paso") contiene una bola.
El caso en el que no es así es relativamente sencillo. El penúltimo paso dejó una bola en la penúltima urna. Si no hay ninguna bola allí, significa que el paso anterior sacó la bola de allí, y por lo tanto no sacó una bola de ningún otro lugar. Por lo tanto, en este caso sólo hay un patrón predecesor posible, y es el mismo patrón excepto que todas las bolas, excepto la última, se han desplazado hacia delante en uno. La probabilidad de esta transición es $1/M$ y esta es también la relación de los productos de la brecha, ya que el desplazamiento ha convertido una brecha con $M$ bolas para entrar en un hueco con $1$ balón por venir. Por lo tanto, la condición de estacionariedad se cumple en este caso.
El segundo caso, en el que la penúltima urna contiene una bola, es un poco más complicado; aquí es donde necesitamos la hipótesis de inducción. Para ver de qué estados podría haber surgido ese patrón, podemos desplazarlo hacia atrás en uno (creando un hueco en la parte delantera). Así es como se veía al paso anterior, excepto que hay un hueco donde estaba la bola que ahora está en la última urna. Así que obtenemos los posibles patrones predecesores colocando una bola en uno de estos huecos.
Ahora vamos a truncar el patrón (no desplazado) eliminando la primera urna, y luego desplazar también el patrón truncado (creando un hueco en la parte delantera del patrón truncado). De nuevo tenemos que considerar dos casos, dependiendo de si la primera urna contiene una bola. Si es así, el patrón truncado tiene $M'=M-1,N'=N-1$ y si no lo hace, entonces $M'=M,N'=N-1$ .
De nuevo, el primer caso (cuando la primera urna contiene una bola) es relativamente sencillo. Es útil considerar un ejemplo; consideremos el patrón (no truncado, no desplazado) **-*--**
; entonces tenemos los siguientes patrones:
**-*--**
(original)
-**-*--*
(desplazado)
*-*--**
(truncado)
-*-*--*
(truncado y desplazado).
Los patrones no desplazados tienen los mismos productos de brecha. Los huecos de los patrones desplazados tienen una correspondencia unívoca entre sí y están asociados a los mismos factores de hueco, excepto el hueco de la parte delantera, que vale $M$ en el patrón no truncado y $M-1$ en el patrón truncado. Así, si llenamos el hueco de la parte delantera, todos los factores de hueco son iguales, mientras que si llenamos cualquier otro hueco, obtenemos un factor $M-1$ en lugar de $M$ en el patrón truncado. Pero esto funciona perfectamente, ya que las probabilidades de transición son $1$ si llenamos el hueco de la parte delantera, y si llenamos cualquier otro hueco, $1/(M-1)$ en el caso truncado y $1/M$ en el caso no truncado. Así, la condición de estacionariedad para el patrón no truncado se deduce de la del patrón truncado, que se cumple por la hipótesis de inducción.
El segundo caso (cuando la primera urna está vacía) es un poco más complicado. Volvamos a utilizar un ejemplo:
-*-*--**
(original)
--*-*--*
(desplazado)
*-*--**
(truncado)
-*-*--*
(truncado y desplazado).
Ahora hay un hueco más en el patrón desplazado no truncado que en el truncado desplazado (dos en la parte delantera en lugar de sólo uno), por lo que hay un término más en la condición de estacionariedad. Si numeramos los huecos en el patrón desplazado no truncado empezando por $0$ en la parte delantera y denota los productos de la brecha que obtenemos al rellenar la brecha $i$ en los patrones desplazados no truncados y truncados por $g_i$ y $g_i'$ respectivamente, y los productos de brecha de los patrones no desplazados por $g$ y $g'$ las condiciones de estacionalidad son
$$ \begin{eqnarray} 1\cdot g_0+\frac1Mg_1+\frac1M\sum_{i>1}g_i &=& g\,\,\,\text{(untruncated),}\\ 1\cdot g_1'+\frac1M\sum_{i>1}g_i' &=& g'\,\,\,\text{(truncated).} \end{eqnarray} $$
Pero $Mg_0=(M-1)g_1$ ya que los patrones correspondientes sólo difieren en si el primer hueco está antes o después de la primera bola, por lo que la primera condición se puede reescribir como
$$ 1\cdot g_1+\frac1M\sum_{i>1}g_i=g\;. $$
Los factores de desfase son los mismos en los casos truncados y no truncados, excepto por un factor adicional $M$ para los patrones no truncados, así que esto es sólo un múltiplo de la condición para el caso truncado, que se mantiene por la hipótesis de inducción. Esto completa la prueba por inducción.
La tasa de aciertos es la suma de las probabilidades estacionarias de todos los patrones con una bola en la primera urna, que es la suma de los productos de los huecos de todos esos patrones dividida por la suma de los productos de los huecos de todos los patrones. Denotemos por $f(M,N)$ la suma de los productos de la brecha para todos los patrones. Entonces la suma de los productos de hueco para los patrones con una bola en la primera urna es $f(M-1,N-1)$ ya que los patrones correspondientes con la primera urna y la bola eliminada tienen los mismos productos de hueco. Por otro lado, la suma de los productos de hueco para los patrones sin bola en la primera urna es $Mf(M,N-1)$ ya que los patrones correspondientes con la primera urna y el hueco eliminados contienen un factor menos $M$ para el hueco que falta. Así pues, tenemos $f(M,N)=f(M-1,N-1)+Mf(M,N-1)$ y el porcentaje de aciertos es $f(M-1,N-1)/f(M,N)$ . Junto con las condiciones iniciales $f(0,N)=0$ (ya que siempre debe haber una bola en la última urna) y $f(N,N)=1$ (ya que en este caso sólo hay un estado y su producto vacío es $1$ ), esta es la recursión que encontró eBusiness.
P.D.: Nótese que hay una correspondencia directa entre los recuentos de estados en la respuesta de leonbloy y los productos de brecha en la mía, ya que mis factores de brecha corresponden al número de colores posibles para la brecha en el enfoque de leonbloy.
0 votos
Los números de las bolas no juegan ningún papel en esta descripción del problema; ¿es eso lo que pretende?
0 votos
Sí, no son importantes.
7 votos
Los downvotes pueden ser más útiles (para el cartel y para el sitio) si van acompañados de algún comentario...
0 votos
Yo tampoco entiendo el downvote. A mí me parece una pregunta razonable, y la respuesta de joriki parece apoyarla.
2 votos
¿Podría ser que el votante no supiera que las FAQ animan a publicar preguntas cuya respuesta se conoce?
2 votos
He borrado mi respuesta porque, como bien has señalado, hacía suposiciones independentistas injustificadas. Puedo reproducir tus resultados individuales mediante procesos de Markov individuales, pero aún no he descubierto cómo generalizarlos.
0 votos
Para $N=6$ , $M=3$ Me sale $p=1/6$ -- parece que está surgiendo un patrón...
0 votos
Ese resultado es correcto. Pero yo no aconsejaría buscar patrones...
0 votos
Hay una estructura jerárquica sorprendente en las distribuciones de estado estacionario que parece que podría explicar la relación de recursividad que encontró eBusiness -- estoy tratando de derivar una expresión explícita para las distribuciones de estado estacionario.
0 votos
He averiguado cómo la distribución en estado estacionario conduce a la recursión encontrada por eBusiness -- será un poco complicado escribirlo claramente, pero debería publicar los detalles en breve.
0 votos
@joriki: Genial. Publicaré mi(s) propia(s) derivación(es) mañana sábado - a menos que alguien se me adelante. También algunas asintóticas para grandes N,M .
0 votos
" Tengo una solución, (con dos pruebas diferentes - las publicaré pronto en la respuesta de abajo) pero me gustaría saber de otros intentos - o tal vez alguna referencia - esto probablemente debe haber sido estudiado en alguna parte". No has aportado ni siquiera cuál era tu planteamiento
0 votos
@RandinMichaelDivelbiss Si te desplazas un poco hacia abajo deberías poder leer mi respuesta.