6 votos

Covarianza de las estadísticas de pedidos

Soy un investigador en ciencias sociales y he encontrado la siguiente formulación matemática de un problema en mi campo. Tenga en cuenta que soy relativamente nuevo en el intercambio de pilas y ya he publicado esto en math.stackexchange así como en mathoverflow, antes de que me pidieran que lo publicara aquí. Por favor, háganme saber si debo borrar el doble post de los sitios (de lo contrario, definitivamente actualizaré todos los sitios cuando reciba una respuesta). Gracias!

Deje que $x_1,x_2,...,x_n,x_{n+1}$ ser $n+1$ i.i.d. variable aleatoria con soporte no negativo y masa de probabilidad estrictamente positiva alrededor de cero. Que $$z_k \equiv \min\ {x_1,...,x_k\}.$$

En las simulaciones, encuentro $Cov(z_{n+1},z_n)$ para estar muy cerca de $Var(z_{n+1})$ y muy diferente de $Var(z_{n})$ siempre y cuando $n>>1$ . He intentado esto para muchas distribuciones (con apoyo no negativo): $Cov(z_{n+1},z_n) / Var(z_{n+1}) \approx 1$ y la aproximación mejora a medida que $n$ aumenta, incluso para pequeños $n$ como $n=5$ . Por otro lado, $Cov(z_{n+1},z_n)/Var(z_n)$ está muy lejos de la 1.

¿Cómo puedo formalizar esto? Es decir, estoy buscando algún tipo de límites sobre cómo la aproximación mejora con $n$ . Por supuesto, como $n \to\infty $ , $Var(z_n)=Var(z_{n+1})$ así que estoy buscando resultados ya sea para $n$ finito, o un resultado asintótico que toma $n$ a $ \infty $ en $m \equiv floor(c \cdot n)$ por constante $c>1$ de tal manera que $Cov(z_n,z_m)$ está más cerca de $Var(z_m)$ que $Var(z_n)$ .

Nótese que la aproximación sólo funciona para X con soporte no negativo y tiene una masa de probabilidad positiva en un vecindario alrededor de cero. Creo que a partir de los resultados de la teoría de los valores extremos, tales distribuciones tienen una distribución exponencial en el límite. No sé si esto es importante.

3voto

wolfies Puntos 2399

Deje que $(X_1, \dots ,X_n,X_{n+1})$ denotan una muestra aleatoria de tamaño $(n+1)$ se ha dibujado en $X$ y dejar que $$Z_n = \min\ {X_1,...,X_n\} \quad \text {and} \quad Z_{n+1} = \min\ {X_1,...,X_n,X_{n+1}\}$$

Al incluir el extra $X_{n+1}$ término, sólo hay 2 posibilidades:


  • SOBRE EL CASO A $ \rightarrow $ con probabilidad $ \frac {n}{n+1}$

$ \quad \quad \text {The extra term } X_{n+1}$ NO cambia el mínimo de la muestra es decir. $z_{n+1} = z_n$ . Entonces..:

$$ \text {Cov}(Z_n, Z_{n+1}) \big |_ \text {Case A} \; = \; \text {Cov}(Z_{n+1}, Z_{n+1}) \; = \; \text {Var}(Z_{n+1})$$

Dado que el evento A ocurre con probabilidad $ \frac {n}{n+1}$ esto explica inmediatamente por qué su observada covarianza incondicional $ \text {Cov}(Z_n, Z_{n+1})$ está bien aproximado por $ \text {Var}(Z_{n+1})$ como $n$ aumenta.


  • O CASO B $ \rightarrow $ con probabilidad $ \frac {1}{n+1}$

$ \quad \quad \text {The extra term } X_{n+1}$ CAMBIA EL MÍNIMO DE MUESTRAS es decir. $Z_{n+1} < Z_n$ . Luego $Z_{n+1}$ y $Z_n$ debe ser el $1^{ \text {st}}$ y $2^{ \text {nd}}$ ordenar estadísticas a partir de una muestra de tamaño $n+1$ es decir.

$$ \text {Cov}(Z_n, Z_{n+1}) \big |_ \text {Case B} \; = \; \text {Cov} \big (X_{(1)}, X_{(2)} \big ) \text { in a sample of size: } n+1$$


En resumen:

\begin {alineado*} \displaystyle \text {Cov}(Z_n, Z_{n+1}) \ ~ - &= \frac {n}{n+1} \text {Cov}(Z_n, Z_{n+1}) \big |_ \text {Caso A} \quad + \quad \frac {1}{n+1} \text {Cov}(Z_n, Z_{n+1}) \big |_ \text {Caso B} \\ &= \frac {n}{n+1} \text {Var}(Z_{n+1}) \quad + \quad \frac {1}{n+1} \text {Cov} \big (X_{(1)}, X_{(2)} \big )_{ \text {Tamaño de la muestra } = n+1} \\ & \end {alineado*}

Esto hace que sea fácil ver por qué el resultado es similar a $ \text {Var}(Z_{n+1})$ porque el caso A domina con probabilidad $ \frac {n}{n+1}$


Ejemplo y comprobación: Padre Uniforme

En el caso de $X \sim \text {Uniform}(0,1)$ padre:

  • Caso A: $ \text {Var}(Z_{n+1}) = \text {Var}(X_{(1)})_{ \text {sample size } = n+1} = \frac {n+1}{(n+2)^2 (n+3)}$

  • Caso B: $ \text {Cov} \big (X_{(1)}, X_{(2)} \big )_{ \text {sample size } = n+1} = \frac {n}{(n+2)^2 (n+3)}$

  • Entonces..: $ \text {Cov}(Z_n, Z_{n+1}) = \frac {n}{(n+1) (n+2) (n+3)}$

El siguiente diagrama compara:

  • esta solución teórica exacta para $ \text {Cov}(Z_n, Z_{n+1})$ como $n$ aumenta de 1 a 30 $ \rightarrow $ la curva roja

  • a un cálculo de Monte Carlo de $ \text {Cov}(Z_n, Z_{n+1})$ $ \rightarrow $ los puntos azules

Se ve bien.


El siguiente diagrama compara la solución teórica exacta para $ \text {Cov}(Z_n, Z_{n+1})$ , $ \text {Var}(Z_n)$ y $ \text {Var}(Z_{n+1})$ como informa la OP, para el momento en que $n = 5$ , $ \text {Cov}(Z_n, Z_{n+1})$ está bien aproximado por $ \text {Var}(Z_{n+1})$ :

0voto

guest Puntos 1

Esto parece implicar que Var(zn)/Var(zn+1) si está lejos de 1 también. Si zi es realmente el mínimo de una muestra de tamaño i, entonces para los ejemplos computables estándar, como la distribución exponencial, la relación de varianzas es cercana a 1 para n razonablemente grande, por ejemplo ((n+1)/n)^2 para la exponencial. ¿Quizás estás simulando la estadística de segundo orden más pequeña?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X