43 votos

Distribución de los productos escalares de dos vectores unitarios aleatorios en $D$ dimensiones

Si $\mathbf{x}$ y $\mathbf{y}$ son dos vectores unitarios aleatorios independientes en $\mathbb{R}^D$ (distribuidos uniformemente en una esfera unitaria), ¿cuál es la distribución de su producto escalar (producto punto) $\mathbf x \cdot \mathbf y$ ?

Supongo que como $D$ crece la distribución rápidamente (?) se convierte en normal con media cero y varianza decreciente en dimensiones superiores $$\lim_{D\to\infty}\sigma^2(D) \to 0,$$ pero ¿existe una fórmula explícita para $\sigma^2(D)$ ?

Actualización

Hice algunas simulaciones rápidas. Primero, generando 10000 pares de vectores unitarios aleatorios para $D=1000$ es fácil ver que la distribución de sus productos de punto es perfectamente gaussiana (de hecho ya es bastante gaussiana para $D=100$ ), véase la subtrama de la izquierda. En segundo lugar, para cada $D$ que van de 1 a 10000 (con pasos crecientes) generé 1000 pares y calculé la varianza. El gráfico logarítmico se muestra a la derecha, y está claro que la fórmula se aproxima muy bien con $1/D$ . Tenga en cuenta que para $D=1$ y $D=2$ esta fórmula da incluso exacto resultados (pero no estoy seguro de lo que ocurre después).

dot products between random unit vectors

2voto

hpy Puntos 374

Para responder a la primera parte de tu pregunta, denota $Z = \langle X,Y \rangle = \sum X_i Y_i$ . Definir $$ f_{Z_i}(z_i) = \int_{-\infty}^\infty f_{Z_1,\ldots,Z_D}(z_1,\ldots,z_D) \: d z_i $$ El producto de la $i^{th}$ elementos de $X$ y $Y$ denotado aquí como $Z_i$ se distribuirá según la distribución conjunta de $X_i$ y $Y_i$ . $$ f_{Z_i}(z_i) = \int_{-\infty}^\infty f_{X_i,Y_i}(x,\frac{z_i}{x})\frac{1}{|x|}dx $$ entonces desde $Z = \sum Z_i$ , $$ f_Z(z) = \int_{-\infty}^\infty \ldots \int_{-\infty}^\infty f_{Z_1,\ldots,Z_D} (z_1,\ldots,z_d) \: \delta(z - \sum z_i)\: dz_1\ldots d z_d $$

Para la segunda parte, creo que si se quiere decir algo interesante sobre el comportamiento asintótico de $\sigma$ es necesario que al menos se asuma la independencia de $X$ y $Y$ y luego aplicar un CLT.

Por ejemplo, si estuviera dispuesto a asumir que el $\{Z_1,\ldots,Z_D\}$ son i.i.d con $\mathbb{E}[Z_i] = \mu$ y $\mathbb{V}[Z_i] = \sigma^2$ se podría decir que $\sigma^2(D) = \frac{\sigma^2}{D}$ y $\lim_{D\to\infty} \sigma^2(D) = 0$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X