20 votos

La probabilidad de que una secuencia tenga sumas parciales pequeñas

La cuestión

Sea $a_1,a_2,\dots,a_n$ sea una secuencia cuyas entradas sean +1 o -1. Sea t un parámetro. Mi pregunta es dar una estimación para el número de tales secuencias de modo que

$|a_1+a_2+\dots a_k| \le t$ para cada $k$ , $1 \le k\le n$ .

(En otras palabras, la probabilidad de que una secuencia aleatoria satisfaga la relación anterior).

Me interesa especialmente esta probabilidad cuando t es pequeño. O bien es una constante, o crece lentamente (digamos que se comporta como (log n)^s para algún número real s, o más lentamente).

variaciones

1) También me gustaría saber cuál es la situación si se exige que el valor medio de |a_1+a_2+ \dots a_k| es menor que t, en lugar del valor máximo.

2) Si hay estimaciones más delicadas para el caso de que la propia t sea una función de k, por ejemplo, que la propia t crezca como (log n)^s, yo también estaría muy interesado.

Motivación

Esta cuestión es relevante para el reciente esfuerzo colectivo ( polímata5 ) sobre el Problema de la Discrepancia de Erdos (EDP). En particular, es relevante para un heurística probabilística sobre cuál debe ser la respuesta al PDE y a varias preguntas relacionadas.

También es relevante para ciertos enfoques probabilísticos hacia la construcción de secuencias con baja discrepancia.

Expectativa

Es de esperar que se conozcan las respuestas a las preguntas anteriores. Pero yo no las conozco. Es fácil convencerse, por ejemplo, de que cuando t está acotado el número de tales secuencias es $c_t^{-n}$ para $c_t<2$ pero me gustaría saber la dependencia de c_t con t.

12voto

Sergio Acosta Puntos 6450

Para $t$ fijo, el recuento es proporcional a $\lambda^n$ donde $\lambda = 2 \cos \frac\pi{2t+2}$ es el valor propio principal de la matriz de adyacencia del trayecto con $2t+1$ vértices. El vector propio todo positivo (Perron-Frobenius) correspondiente a $\lambda$ es

$$\bigg(\sin \frac{\pi}{2t+2}, \sin \frac{2\pi}{2t+2},\sin \frac{2\pi}{2t+2},\dots,sin \frac{(2t+1)\pi}{2t+2}\bigg).$$

Desde $-\lambda$ es también un valor propio, el comportamiento estable de la distribución de los puntos finales de las trayectorias que permanecen en $[-t,t]$ es una oscilación entre las entradas impar

$$\bigg(\sin \frac{\pi}{2t+2}, 0,\sin \frac{3\pi}{2t+2},0,\dots,\sin \frac{(2t-1)\pi}{2t+2},0,\sin \frac{(2t+1)\pi}{2t+2}\bigg).$$ e incluso entradas $$\bigg(0,\sin \frac{2\pi}{2t+2}, 0,\sin \frac{4\pi}{2t+2},0,\cdots ,0,\sin \frac{2t\pi}{2t+2},0\bigg).$$

El recuento exacto de rutas que permanecen en $[-t,t]$ es una suma de coeficientes binomiales con signo.

El número de rutas de $0$ a $i$ es 0 si $n \not \equiv i ~\mod 2$ y $n \choose (n\pm i)/2$ cuando $n \equiv i ~\mod 2$ .

El número de caminos que nunca salen $[-t,t]$ de $0$ a $i \in [-t,t]$ con $n \equiv i ~\mod 2$ es

$$ \sum_{j\in \mathbb Z} (-1)^j {n\choose (n +i)/2 + j(t+1)}$$

por el principio de reflexión aplicado al grupo de isometrías de $\mathbb R$ generada por la reflexión sobre $t+1$ y $-t-1$ .

Si se suman todos $i \in [-t,t]$ entonces cuando $n$ es par, se obtiene una suma con signo de coeficientes binomiales con $t+1$ signos positivos seguidos alternados con $t+1$ signos negativos seguidos. Si $n$ es impar, entonces se obtiene $t$ signos positivos seguidos, omita un término (dele un coeficiente de $0$ en lugar de $\pm 1$ ), entonces $t$ signos negativos seguidos, saltarse un término, etc.

Por ejemplo, para $n=100, t=2,$ el número de caminos es

$$ ... +{100\choose 43} + {100\choose 44} + {100 \choose 45} - {100 \choose 46} - {100 \choose 47} - {100\choose 48} + {100\choose 49} + {100 \choose 50} + {100\choose 51} - ...$$

Para $n=101, t=2,$ el número de caminos es

$$ ... +{101\choose 44} + {101\choose 45} - {101\choose 47} - {101 \choose 48} + {101\choose 50} + {101\choose 51} - {101\choose 53} - {101\choose 54} + ...$$

Se pueden sumar utilizando las técnicas de las respuestas a la pregunta Pregunta sobre la paridad de la distribución binomial .

Se puede decir mucho más cuando $t$ varía, pero las respuestas son más complicadas. En $t$ aumentando lentamente, ya que $c\sqrt[3]n$ hay tiempo suficiente para que la distribución se estabilice (para cada paridad) en un valor dado de $t$ ya que la relación entre las magnitudes de los dos mayores valores propios y las magnitudes de los dos siguientes es de aproximadamente $1+c/t^2$ y los vectores propios principales tienen un pequeño $L^1$ distancia para valores adyacentes de $t$ . Debe recoger un factor constante para cada transición. En otras palabras, el número de trayectorias cuando pasa al menos $n_t \gt c t^2$ pasos en un determinado $t$ debe ser

$$C \prod_{t \le t_{max}} (2 \cos \frac{\pi}{2t+2})^{n_t}$$

donde $C$ está entre algunas funciones $f_{lower}(t_{max}) \lt C \lt f_{upper}(t_{max})$ que no depende de los valores de $n_t$ . No creo que el $n_t \gt c t^2$ es aguda para este comportamiento. Algo como $n_t \gt c t^2/\log t$ también debería funcionar. La geometría de los vectores propios para valores adyacentes de $t$ le permite estimar $f_{lower}$ y $f_{upper}$ .

Para $t$ aumento más rápido, se producen comportamientos diferentes. Por la ley del logaritmo iterado, si $t$ aumenta a medida que $t(n) = \sqrt {(2-\epsilon) n \log\log n},$ caminos aleatorios violarán casi con toda seguridad la restricción. Creo que hay versiones precisas de la ley del logaritmo iterado que pueden indicarte cuándo una proporción positiva de caminos aleatorios no viola la restricción. Supongo que si $t(n) = \sqrt{(2+\epsilon) n \log\log n}$ entonces un porcentaje positivo de caminos aleatorios no violará la restricción.

7voto

Pierre Spring Puntos 2398

He aquí un complemento útil y referencias a las respuestas existentes. Hace unos días planteé a Yuval Peres la pregunta formulada de la siguiente manera:

¿Cuál es la probabilidad rando simple confinado en el $[-K,K]$ ?

La respuesta de Yuval unas horas más tarde fue:

La probabilidad de confinamiento en [-K,K] d $\exp(-cn/K^2)$ donde $c$ es conocido: es es $\pi/2$ . Esto es clásico y en el volumen 2 de Feller o en el libro de Spitzer. en el libro de Spitzer. Thi $K=o(\sqrt{n})$ .

Me interesaba especialmente (a efectos de polymath5) el valor de $K=K(n)$ para la que esta probabilidad es $2^{-n/\log n}$ . La respuesta a esta pregunta concreta es la siguiente $K=C\sqrt{\log n}$ para un $C$ .

2voto

Matthew Jaskula Puntos 686

Como heurística perezosa, se puede considerar la siguiente construcción.

Considere la siguiente operación $F$ en secuencias. Dada una secuencia $S$ identificamos en $S$ el primer lugar $q$ donde la suma parcial deja $\pm t$ . Identificamos el último lugar $r$ precede $q$ en el que permanece dentro $\pm t/2$ . Entonces dejamos que $F(S)$ sea la secuencia obtenida a partir de $S$ intercambiando los signos de todos los elementos del $r$ º lugar. Por supuesto, si aplicamos $F$ un número suficiente de veces a cualquier secuencia obtendremos una secuencia cuyas sumas parciales están acotadas en $\pm t$ . La cuestión es cuántas veces debemos aplicar $F$ a una secuencia típica?

Esperamos que para un $S$ el valor de $q-r$ se trata de ${t^2}/4$ . Además, por definición, si $q$ es el lugar en el que las sumas parciales de $F$ primer permiso $\pm t$ y $q'$ es el primer lugar en el que las sumas parciales de $F(S)$ dejar $\pm t$ , luego el último lugar $r'$ precede $q'$ en la que las sumas parciales de $F(S)$ permanecer en $\pm t/2$ satisface $r'\geq q$ . De ello se deduce que esperamos aplicar $F$ acerca de $4n/t^2$ veces a una secuencia generada aleatoriamente $S$ para obtener una secuencia cuyas sumas parciales estén acotadas dentro de $\pm t$ . De ello se deduce que deberíamos esperar que la probabilidad de que una secuencia aleatoria tenga sumas parciales acotadas por $\pm t$ se trata de $2^{-4n/t^2}$ .

No debería ser tan difícil convertir esto en un buen argumento de que la probabilidad es $2^{-c_tn}$ para algunos $c_t$ creciendo aproximadamente como $t^{-2}$ (quizás con algunos factores de registro..).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X