6 votos

Valor esperado de$\max\limits_{1\leq i\leq m}X_i-\min\limits_{1\leq i\leq m} X_i$ para el problema de bolas y bins

Recientemente me encontré con el siguiente problema que ha ocupado a mí durante un par de semanas. Esto es sólo por curiosidad, y también no puedo encontrar cualquier documento de investigación sobre esta cuestión en particular .

Problema : Dado $N$ bolas, cada bola se coloca en una caja elegido uniformally al azar entre los $m $ cajas numeradas, Deje $X_i $ el valor de la variable aleatoria contando el número de bolas en el cuadro de $i$. Definir $Y=\max\limits_{1\leq i\leq m}X_i-\min\limits_{1\leq i\leq m} X_i$. ¿Cuál es el valor esperado y la varianza de la variable $Y$?

Estoy buscando alguna referencia o un trabajo de investigación, proporcionando una respuesta (aproximaciones) para el problema al $\mathbf{N}$ es grande y $m$ es constante.

4voto

psychotik Puntos 171

No satifactory respuesta, pero aquí es una pequeña observación: Si $M_m := \mathbb{E}\left[\max_{1\leq i\leq m} W_i \right]$ denota la expectativa de que el máximo de $m$ i.yo.d. normal estándar de las variables de $W_1, \cdots, W_m$, luego tenemos

$$\lim_{N\to\infty} \frac{1}{\sqrt{N}}\mathbb{E}\left[ \max_{1\leq i \leq m} X_i - \min_{1\leq i \leq m} X_i \right] = \frac{2M_m}{\sqrt{m}} . \etiqueta{*}$$

La idea es la siguiente. A grandes rasgos, la principal fuente de la correlación entre el $X_i$s'es la condición de que la suma total $X_1 + \cdots + X_m$ es fijo. Es decir, podemos pensar libremente de cada una de las $X_i$ como el siguiente re-centrado en la versión

$$ X_i \quad {``}\approx{\text{''}} \quad \tilde{X}_i + \frac{N}{m} - \frac{\sum_{k=1}^m\tilde{X}_k}{m} $$

de algunos me.yo.d. variables aleatorias $\tilde{X}_1, \cdots, \tilde{X}_m$. Desde esta re-centralizador no afecta a la diferencia, esperamos que $Y \approx \tilde{Y} := \max_i \tilde{X}_i - \min_i \tilde{X}_i$. Tomando ventaja de la independencia, es más fácil investigar $\tilde{Y}$ lugar.


Aquí está una descripción más detallada del argumento. Si tenemos en cuenta

$$ \tilde{Z}_i = \frac{X_i - (N/m)}{\sqrt{N/m}} $$

entonces el vector aleatorio $\tilde{Z} = (\tilde{Z}_1, \cdots, \tilde{Z}_m)$ converge en distribución a la distribución normal multivariante $\mathcal{N}(0, C)$ con la matriz de covarianza $C$ satisfactorio

$$ C_{ij} = \delta_{ij} - \frac{1}{m}.$$

Por lo tanto, consideramos un vector normal multivariante $Z = (Z_1, \cdots, Z_m) \sim \mathcal{N}(0, C)$. También la introducción de una variable normal $\bar{Z} \sim \mathcal{N}(0, \frac{1}{m})$ que es independiente de la $Z$. Por último, considere la posibilidad de $W_i = Z_ i + \bar{Z}$. Entonces podemos fácilmente calcular que

$$ \operatorname{Cov}(W_i, W_j) = C_{ij} + \frac{1}{m} = \delta_{ij}, $$

a partir de la cual nos encontramos con que $(W_i)$ es un yo.yo.d. estándar normal de las variables. Desde $Z_i - Z_j = W_i - W_j$, podemos estudiar el máximo y el mínimo de $W$ lugar. Así

\begin{align*} \mathbb{E}\left[\max_i Z_i - \min_i Z_i\right] = \mathbb{E}\left[\max_i W_i - \min_i W_i\right] = 2\mathbb{E}\left[\max_i W_i\right] = 2M_m \end{align*}

Mediante esto podemos demostrar que $\text{(*)}$ mantiene.

2voto

Will Green Puntos 758

Has visto:

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X