20 votos

La probabilidad de que una secuencia de pequeños importes parciales

La pregunta

Deje $a_1,a_2,\dots,a_n$ ser una secuencia cuyas entradas son +1 o -1. Sea t un parámetro. Mi pregunta es para dar una estimación para el número de este tipo de secuencias, de manera que

$|a_1+a_2+\dots a_k| \le t$, para cada $k$, $1 \le k\le n$.

(En otras palabras, la probabilidad de que una secuencia aleatoria va a satisfacer la anterior relación.)

Estoy especialmente interesado en esta probabilidad cuando t es pequeño. Una constante, o de crecimiento lento (es decir, se comporta como (log n)^s para algún número real s o más lento).

variaciones

1) también me gustaría saber cuál es la situación en caso de que la demanda de que el valor promedio de |a_1+a_2+\dots a_k| es menor que t, más bien que el valor máximo.

2) Si hay más delicada de las estimaciones para el caso de que t sí mismo es una función de k por ejemplo, t crece como (log n)^s, yo estaría muy interesado así.

La motivación

Esta pregunta es relevante para el reciente esfuerzo colectivo (polymath5) con respecto a la Erdos Discrepancia Problema (EDP). Lo particular es relevante para un probabilístico heurística respecto a lo que la respuesta a EDP, y a varias preguntas relacionadas con, debe ser.

También es relevante para ciertos probabilístico enfoques hacia la construcción de secuencias de baja discrepancia.

Expectativa

Yo esperaría que las respuestas a las preguntas anteriores son conocidos. Pero ellos no me conocen. Es fácil ser convencido, por ejemplo, que cuando t es acotado el número de secuencias es$c_t^{-n}$$c_t<2$, pero me gustaría saber la dependencia de c_t en t.

12voto

Sergio Acosta Puntos 6450

Para $t$ fijo, el recuento es proporcional a $\lambda^n$ donde $\lambda = 2 \cos \frac\pi{2t+2}$ es el principal autovalor de la matriz de adyacencia de la ruta con $2t+1$ vértices. La de todos los positivos (Perron-Frobenius) vector propio correspondiente a $\lambda$ es

$$\bigg(\sin \frac{\pi}{2t+2}, \sin \frac{2\pi}{2t+2},\sin \frac{2\pi}{2t+2},\dots,sin \frac{(2t+1)\pi}{2t+2}\bigg).$$

Desde $-\lambda$ también es un autovalor, el comportamiento estable de la distribución de los extremos de los caminos, que la estancia en $[-t,t]$ es una oscilación entre el impar de entradas

$$\bigg(\sin \frac{\pi}{2t+2}, 0,\sin \frac{3\pi}{2t+2},0,\dots,\sin \frac{(2t-1)\pi}{2t+2},0,\sin \frac{(2t+1)\pi}{2t+2}\bigg).$$ e incluso entradas $$\bigg(0,\sin \frac{2\pi}{2t+2}, 0,\sin \frac{4\pi}{2t+2},0,\cdots ,0,\sin \frac{2t\pi}{2t+2},0\bigg).$$

El recuento exacto de las rutas que se alojen en $[-t,t]$ es una suma de firmados los coeficientes binomiales.

El número de caminos de $0$ $i$es 0 si $n \not \equiv i ~\mod 2$, e $n \choose (n\pm i)/2$ al $n \equiv i ~\mod 2$.

El número de caminos que nunca deje $[-t,t]$ $0$ $i \in [-t,t]$ $n \equiv i ~\mod 2$es

$$ \sum_{j\in \mathbb Z} (-1)^j {n\choose (n +i)/2 + j(t+1)}$$

por el reflejo principio se aplica para el grupo de isometrías de $\mathbb R$ generado por la reflexión acerca de la $t+1$$-t-1$.

Si usted suma de todos los $i \in [-t,t]$, luego al $n$ es, incluso, obtener una firma de la suma de los coeficientes binomiales con $t+1$ signos positivos en una fila, alternando con $t+1$ signos negativos en una fila. Si $n$ es impar, entonces usted consigue $t$ signos positivos en una fila, de saltar de un término (dar un coeficiente de $0$ en lugar de $\pm 1$), $t$ signos negativos en una fila, de saltar de un plazo, etc.

Por ejemplo, para $n=100, t=2,$ el número de rutas es

$$ ... +{100\choose 43} + {100\choose 44} + {100 \choose 45} - {100 \choose 46} - {100 \choose 47} - {100\choose 48} + {100\choose 49} + {100 \choose 50} + {100\choose 51} - ...$$

Para $n=101, t=2,$ el número de rutas es

$$ ... +{101\choose 44} + {101\choose 45} - {101\choose 47} - {101 \choose 48} + {101\choose 50} + {101\choose 51} - {101\choose 53} - {101\choose 54} + ...$$

Estos pueden resumirse mediante las técnicas en las respuestas a la distribución Binomial paridad pregunta.

Mucho más se puede decir al $t$ varía, pero las respuestas son más complicadas. Para $t$ aumentando lentamente, como $c\sqrt[3]n$, hay tiempo suficiente para la distribución a estabilizar (para cada una de paridad) a un determinado valor de $t$, ya que la relación entre las magnitudes de los más grande de los dos autovalores y las magnitudes de los próximos dos es acerca de $1+c/t^2$, y los principales vectores propios tienen un pequeño $L^1$ distancia para valores adyacentes de $t$. Usted debería recoger un factor constante para cada transición. En otras palabras, el número de rutas de acceso al gastar al menos $n_t \gt c t^2$ pasos en un determinado $t$ debe ser

$$C \prod_{t \le t_{max}} (2 \cos \frac{\pi}{2t+2})^{n_t}$$

donde $C$ es entre algunas de las funciones de $f_{lower}(t_{max}) \lt C \lt f_{upper}(t_{max})$, que no depende de los valores de $n_t$. No creo que el $n_t \gt c t^2$ condición es fuerte para este comportamiento. Algo como $n_t \gt c t^2/\log t$ debe trabajar, también. La geometría de los vectores propios para valores adyacentes de $t$ le permite estimar el $f_{lower}$$f_{upper}$.

Para $t$ más rápido aumento, los diferentes comportamientos que se producen. Por la ley del logaritmo iterado, si $t$ aumenta a medida $t(n) = \sqrt {(2-\epsilon) n \log\log n},$ rutas aleatorias casi seguramente violar la restricción. Creo que no se precisa versiones de la ley del logaritmo iterado que pueden decirle a usted cuando un positivo proporción de rutas aleatorias no violan la restricción. Me imagino que si $t(n) = \sqrt{(2+\epsilon) n \log\log n}$, un porcentaje positivos de rutas aleatorias no violar la restricción.

7voto

Pierre Spring Puntos 2398

Aquí es un complemento útil y referencias a las respuestas existentes. Me preguntó Yuval Peres hace un par de días a la pregunta formulada de la siguiente manera:

¿Cuál es la probabilidad de que el simple caminata aleatoria de n pasos se confinado en el intervalo de $[-K,K]$?

Yuval la respuesta de un par de horas más tarde fue:

El confinamiento de la probabilidad en [-K,K] decae hasta un constante como $\exp(-cn/K^2)$ donde $c$ es conocido: es $\pi/2$. Este es el clásico y usted puede encontrar que, por ejemplo, en Feller volumen 2 o en Spitzer libro. Esto es válido para todas $K=o(\sqrt{n})$.

Yo estaba especialmente interesado (por polymath5) en el valor de $K=K(n)$ para que esta probabilidad es $2^{-n/\log n}$. La respuesta a esta consulta específica es, pues, $K=C\sqrt{\log n}$ adecuado $C$.

2voto

Matthew Jaskula Puntos 686

Como un perezoso heurística, se puede considerar la siguiente construcción.

Considere la siguiente operación $F$ en las secuencias. Dada una secuencia $S$, podemos identificar en $S$ el primer lugar $q$ cuando la suma parcial de hojas de $\pm t$. Identificamos el último lugar $r$ anterior $q$ en el que se mantiene dentro de $\pm t/2$. Luego la dejamos $F(S)$ ser la secuencia obtenida a partir de a $S$ mediante el intercambio de los signos de todos los elementos de la $r$º lugar. Por supuesto, si aplicamos $F$ suficiente muchas veces para cualquier secuencia obtendremos una secuencia cuyas sumas parciales están acotadas en $\pm t$. La pregunta es ¿cuántas veces debemos aplicar $F$ a una secuencia típica?

Esperamos que para un random $S$ $q-r$ es de alrededor de ${t^2}/4$. Además, por definición, si $q$ es el lugar en el que las sumas parciales de $F$ primer deje $\pm t$, e $q'$ es el primer lugar en que las sumas parciales de $F(S)$ deje $\pm t$, en el último lugar $r'$ anterior $q'$ en los que las sumas parciales de $F(S)$ permanecer dentro de $\pm t/2$ satisface $r'\geq q$. De ello se desprende que esperamos se aplican $F$ $4n/t^2$ veces a un generada aleatoriamente la secuencia de $S$ con el fin de obtener una secuencia de cuyas sumas parciales están acotadas dentro de $\pm t$. De ello se deduce que debemos esperar que la probabilidad de que una secuencia aleatoria tiene sumas parciales acotadas por $\pm t$ es de alrededor de $2^{-4n/t^2}$.

No debe ser tan duro para convertir esto en un buen argumento de que la probabilidad es $2^{-c_tn}$ algunos $c_t$ crecido como $t^{-2}$ (tal vez con algunas de registro factores..).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X