5 votos

Definición de paseo aleatorio como una suma de procesos aleatorios independientes

Tengo una pregunta de principiante sobre el paseo aleatorio. Según esto papel

Random walk – the stochastic process formed by successive summation of independent, identically distributed random variable....

Realmente no puedo pasar de la primera línea. Pensaba que el teorema del límite central y la ley de los grandes números establecen que la media de un gran número de procesos aleatorios independientes se aproximará a un proceso normal. Pero el artículo parece indicar que la suma de estos procesos aleatorios es un paseo aleatorio. ¿Así que la media es un proceso normal pero la suma es un paseo aleatorio? ¿Es esto correcto?

3voto

jldugger Puntos 7490

Hay que saber qué es un proceso estocástico es. En este contexto, es sólo una colección de variables aleatorias $(X_0, X_1, X_2, \ldots)$ .

Ver un ejemplo sencillo y trabajado puede ayudar. Pongámoslo en marcha. Supongamos que tenemos una colección de variables independientes $\mathbf Y = (Y_0, Y_1, \ldots)$ , todos con la misma distribución. Por ejemplo, cada $Y_i$ podría representar el lanzamiento de una moneda justa utilizando (digamos) $1$ para las cabezas y $0$ para las colas. Es un proceso estocástico (que podríamos llamar "proceso de Bernoulli").

Se pueden construir nuevos procesos a partir de los antiguos. Una forma es convertir $\mathbf Y$ en su suma acumulada

$$\mathbf X = (Y_0, Y_0+Y_1, Y_0+Y_1+Y_2, \ldots)$$

Este es un paseo aleatorio .


Como ejemplo, consideremos un paseo aleatorio finito de longitud $3$ basado en monedas justas. Ese proceso Bernoulli $\mathbf Y$ tiene ocho resultados posibles, también conocidos como "paseos" o "caminos", cada uno con igual probabilidad de $1/8$ :

$$(0,0,0),\ (0,0,1),\ (0,1,0),\ (0,1,1),\ (1,0,0),\ (1,0,1),\ (1,1,0),\ (1,1,1).$$

Las trayectorias asociadas de $\mathbf X$ calculados mediante sumas acumulativas, son por tanto

$$(0,0,0),\ (0,0,1),\ (0,1,1),\ (0,1,2),\ (1,1,1),\ (1,1,2),\ (1,2,2),\ (1,2,3).$$

Si quieres, ahora puedes identificar las variables de los componentes $X_i$ . Por ejemplo, $X_0$ adquiere el valor $0$ cuatro veces, para una probabilidad total de $4\times 1/8=1/2$ y el valor $1$ cuatro veces, para una probabilidad total de $1/2$ . $X_1$ toma los valores $0, 1,$ y $2$ con probabilidades $1/4, 1/2, 1/4$ respectivamente. Y $X_2$ toma los valores $0,1,2,3$ con probabilidades $1/8, 3/8, 3/8, 1/8$ respectivamente. Obsérvese que estas tres variables no tienen distribuciones idénticas. Las distribuciones también tienen medias y varianzas diferentes: sus medias son $1/2, 1, 3/2$ (por orden) y sus desviaciones son $1/4, 1/2, 3/4$ (por orden).

Las variables componentes de un paseo aleatorio también son dependiente. Por ejemplo, dado que $X_1=0$ (que sólo se da en las rutas $(0,0,0)$ y $(0,0,1)$ ), la posibilidad de que $X_2=0$ es $1/2$ . Pero dado que $X_1=1$ la posibilidad de que $X_2=0$ es ahora cero: simplemente no es posible. Como estas probabilidades condicionales varían con el valor de $X_1$ , $X_1$ y $X_2$ no son independientes. De hecho, ningún par de estas variables componentes es independiente.


El teorema del límite central hace una declaración sobre la distribución de $X_n$ cuando $n$ se hace muy grande. Además de asumir la $Y_i$ (de los cuales el $X_n$ son construidos) son independientes e idénticamente distribuidos, tiene que asumir que esta distribución común tiene una varianza finita. El concepto de proceso estocástico es independiente de cualquier idea de límites (que ni siquiera tendría sentido para uno finito, como en el ejemplo). El CLT sólo es válido para procesos muy especiales.

0voto

Silvercode Puntos 438

Ambas cosas son ciertas.

Imagina que tomo $T$ pasos, $x_t, t=1,...,T$ cada uno normalmente distribuido $x_t \sim N(0,1)$ . Antes de ver cualquier dato, y para cualquier $1<s<T$ tenemos $R_s = \sum_{t=1}^{s}x_t \sim N(0,s)$ - como usted sospechaba.

Sin embargo, supongamos que echamos un vistazo al proceso en algún momento $s$ y por casualidad encontrar que $R_s=100$ . Entonces $R_{s+1} \sim N(100,1)$ . Es decir, si observamos pasos temporales sucesivos, sus valores están vinculados porque comparten la misma historia.

El caso de la media cero sólo se aplica antes de miramos los datos.

Hay sutilezas cuando el espacio entre los pasos de tiempo se reduce al límite. Cuando podemos hablar de la $x_t$ aunque generalmente serán variables aleatorias y no procesos, es $R_s$ que es el proceso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X