6 votos

Expectativa de diferencias por pares entre puntos aleatorios uniformes en hipercubo

Digamos que tiene 2 iid variables aleatorias$x,y\sim U[0,1]^k$, es decir, la distribución uniforme sobre el cubo de la unidad k-dimensional. ¿Cuál es el valor esperado de la distancia euclidiana entre ellos cuando se han normalizado por la distancia máxima posible, es decir,$\sqrt k$?

Para$k=1$, deduje que esto es 1/3. Para$k=100$, las simulaciones de Monte Carlo me dicen que es un poco más de 0.4.

Traté de calcular las matemáticas pero$$\frac{1}{\sqrt{k}}\int_{S_x} \int_{S_y} \sqrt{(x-y)^T (x-y)}\;dx\;dy$ $ donde$S_x,S_y=[0,1]^k$ para general$k$ me supera.

7voto

Did Puntos 1

El asymptotics es $1/\sqrt6=0.40824829$.

Para ver esto, considere yo.yo.d. variables aleatorias $X_i$ $Y_i$ uniforme en $[0,1]$ y escriba la cantidad que se calcula como $I_k=\mathrm E\left(\sqrt{Z_k}\right)$ con $$ Z_k=\frac1k\sum_{i=1}^k(X_i-Y_i)^2. $$ Por la fuerte ley de los grandes números para el yo.yo.d. delimitadas las variables aleatorias, cuando $k\to\infty$, $Z_k\to z$ casi con toda seguridad, y en cada $L^p$,$z=\mathrm E(Z_1)$. En particular, $I_k\to \sqrt{z}$. Numéricamente, $$ z=\iint_{[0,1]^2}(x-y)^2\mathrm{d}x\mathrm{d}y=2\int_0^1x^2\mathrm{d}x-2\left(\int_0^1x\mathrm{d}x\right)^2=2\frac13-2\left(\frac12\right)^2=\frac16. $$


Editar (Esto responde a una cuestión diferente se le preguntó por la OP en los comentarios.)

Considerar el máximo de $n\gg1$ copias independientes de $kZ_k$ $k\gg1$ y llame a $M_{n,k}$ su raíz cuadrada. Una heurística para estimar el comportamiento típico de $M_{n,k}$ es como sigue.

Por el teorema del límite central (y en un sentido riguroso), $Z_k\approx z+N\sqrt{v/k}$ donde $v$ es la variación de $Z_1$ $N$ es un estándar de la variable aleatoria gaussiana. En particular, para cada dado positivo $s$, $$ \mathrm P\left(Z_k\ge z+s\right)\approx\mathrm P\left(N^2\ge ks^2/v\right). $$ Además, el tamaño típico de $M_{n,k}^2$ $z+s$ donde $s$ resuelve $\mathrm P(Z_k\ge z+s)\approx1/n$. Elija $q(n)$ tal que $\mathrm P(N\ge q(n))=1/n$, $q(n)$ es un llamado de los cuantiles de la estándar de la distribución gaussiana. A continuación, el tamaño típico de $M_{n,k}^2$ $k(z+s)$ donde $s$ resuelve $ks^2/v=q(n)^2$. Finalmente, $$ M_{n,k}\approx \sqrt{kz+q(n)\sqrt{kv}}. $$ Numéricamente, $z=1/6$, $v=7/180$, y usted está interesado en $k=1'000$. Para $n=10'000$, $q(n)=3.719$ los rendimientos de un tamaño típico de $M_{n,k}\approx13.78$ y para $n=100'000$, $q(n)=4.265$ por lo tanto $M_{n,k}\approx13.90$ (estos deben ser comparados con los valores observados).

Para hacer riguroso de estas estimaciones y para entender por qué, en un camino, $M_{n,k}$ se concentra en torno a la típica valor que hemos calculado anteriormente, vea aquí.

1voto

Justin Walgran Puntos 552

Esto probablemente no es nada bueno para el general$k$. Estás solicitando$$ E \sqrt{ \sum_{i=1}^k (X_i-Y_i)^2/k } $ $ donde$X_i$ y$Y_i$ son uniformes independientes (0,1). Sin embargo, vamos a$Z_i = (X_i-Y_i)^2$. Ahora estás buscando$$ E \sqrt{ (\sum_{i=1}^k Z_k)/k }$ $ y pensemos qué pasa cuando$k$ se hace grande. Cuando$k$ es grande, por ley de grandes números$(\sum_{i=1}^k Z_k)/k$ se concentrará alrededor de$E(Z_k)$. Por lo tanto, a medida que$k$ crece, espero que la respuesta se aproxime a$\sqrt{E(Z_k)}$, que es$\sqrt{1/6}$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X