24 votos

Prueba del método de Box-Muller

Este es el Ejercicio 2.2.2 de Achim Klenke: »Teoría de la probabilidad - Un curso completo«.

Ejercicio (método de Box-Muller): Sea $U$ y $V$ variables aleatorias independientes uniformemente distribuidas en $[0,1]$. Define $$X := \sqrt{2\log(U)}\, \cos(2\pi V) \quad \text{y} \quad Y := \sqrt{2\log(U)}\, \sin(2\pi V)\, .$$

Demuestra que $X$ e $Y$ son independientes y distribuidas como $\mathcal{N}_{0,1}$.

Solución: Define la variable aleatoria $R := \sqrt{-2\log(U)}$, entonces \begin{align*} \mathbf{P}\bigl[R \leq r\bigr] & = \mathbf{P}\bigl[-2 \log(U) \leq r^2\bigr] = \\ & = \mathbf{P}\bigl[\log(U) \geq -\frac{r^2}{2}\bigr] = \\ & = 1 - \mathbf{P}\biggl[U < \exp\Bigl(-\frac{r^2}{2}\Bigr)\biggr]\, . \end{align*} $U$ está uniformemente definida en $[0,1]$, entonces la distribución de $R$ es $$\mathbf{P}[R\leq r] = 1 - \int_0^{\exp(-r^2/2)} \, dt = 1 - \exp\Bigl(-\frac{r^2}{2}\Bigr)\, .$$ Para la densidad de $R$ obtenemos: $f_R(t) = \exp\Bigl(-\frac{t^2}{2}\Bigr)\cdot t$ con $t> 0$.

También definimos la variable aleatoria $\Phi := 2\pi V$. Dado que $V$ está uniformemente distribuida en $[0,1]$, $f_\Phi(t) = \frac{1}{2\pi}$ con $0< t \leq 2\pi$.

Dado que $U, V$ son independientes, $R, \Phi$ también deben ser independientes y $$f_{R, \Phi}(t_1, t_2) = f_R(t_1) f_\Phi(t_2) = \frac{1}{2 \pi} \exp\Bigl(-\frac{t_1^2}{2}\Bigr)\cdot t_1 \, .$$

Con \begin{align*} g\colon (0,\infty)\times(0, 2\pi] &\rightarrow \mathbb{R}^2 \\ (r, \phi) &\mapsto \bigl(r \cos(\phi), r \sin(\phi)\bigr) \end{align*} vemos que $$(X, Y) = g(R, \Phi)\, ,$$ entonces queremos encontrar la medida de la imagen $$\mathbf{P}_{X, Y} = \mathbf{P}_{R, \Phi}\circ g^{-1}\, .$$

Usamos la fórmula de transformación para densidades: $$ f_{X, Y}(\tau_1, \tau_2) = \frac{f_{R, \Phi}(g^{-1}(\tau_1, \tau_2))}{|\det(g'(g^{-1}(\tau_1, \tau_2)))|}$$

$g$ es simplemente la transformación para coordenadas polares. Con $$ t_1 = \sqrt{\tau_1^2 + \tau_2^2} = |\det(g'(g^{-1}(\tau_1, \tau_2)))|$$ finalmente obtenemos $$f_{X, Y}(\tau_1, \tau_2) = \frac{1}{2 \pi} \exp\Bigl(-\frac{\tau_1^2 + \tau_2^2}{2}\Bigr) = \underbrace{\frac{1}{\sqrt{2 \pi}} \exp\Bigl(-\frac{\tau_1^2}{2}\Bigr)}_{=f_X(\tau_1)} \cdot \underbrace{\frac{1}{\sqrt{2 \pi}} \exp\Bigl(-\frac{\tau_2^2}{2}\Bigr)}_{=f_Y(\tau_2)}\, ,$$ es decir: $X, Y$ están distribuidas como $\mathcal{N}_{0, 1}$ y son independientes. $\square$


¿Podrías por favor revisar mi prueba? Lo siento que sea tan larga, me parece correcta, pero estoy estudiando por mi cuenta y realmente necesito detectar cualquier error eventual... ¡Gracias!

5voto

Jonny Puntos 11

También soy físico, y solo por diversión de ver qué tan corto podemos hacer esto, aquí está mi enfoque en esto. El objetivo es aplicar transformaciones de coordenadas que conviertan nuestra distribución objetivo, una gaussiana 2D $P(x, y) = e^{-(x^2 + y^2) / 2}$, en un producto de dos distribuciones uniformes. Uniforme aquí solo significa que $P(x', y') = 1$. En lo siguiente, los cambios de coordenadas se dan mediante flechas.

$$ P(x, y) dx dy = e^{-(x^2 + y^2) / 2} dx dy \to_{\text{coordenadas polares}} r e^{-r^2 /2} dr d\theta = -d \left(e^{-r^2 /2} \right) d\theta \to_{r = -\sqrt{-2\ln u}} du d\theta $$

Como se requiere, la probabilidad transformada $P(u, \theta)$ es uniforme. Al observar los límites, vemos que u se extrae de $[0, 1)$ (ya que $r \in [0, \infty)$ y $e^{-r^2}$ convierte esto en $[0, 1)$) y $\theta$ de $[0, 2\pi)$. Sustituyendo las transformaciones encontramos la respuesta:

Muestra $u \in [0, 1)$ y $\theta \in [0, 2\pi)$. Esto produce dos variables normales: $$ x = \sqrt{-2\ln u}\cos \theta \\ y = \sqrt{-2 \ln u} \sin \theta $$

2voto

gamebm Puntos 36

Me gustaría hacer algunos comentarios complementarios. Es menos riguroso matemáticamente pero podría ser más intuitivo en el sentido de que involucra menos fórmulas, lo cual en cierto nivel también sirve como una prueba.

En principio, dado que la distribución de probabilidad Gaussiana es unidimensional, uno podría preguntarse por qué no se proporciona un mecanismo de generación con solo una variable aleatoria (que, por ejemplo, tome su valor de forma uniforme en el intervalo $[0, 1]$). Esto usualmente se puede llevar a cabo integrando la densidad de probabilidad. (En particular, no es difícil demostrar, si la integral de la densidad de probabilidad $f(x)$ es igual a $1$, es decir, $\int dx f(x) = 1$, entonces el inverso de la función $y(x)=\int^x dx' f(x') $ proporciona precisamente la distribución deseada de $x$, cuando $y$ se elige aleatoriamente del intervalo $[0, 1]$.)

Para el caso presente, el problema es que la integral relacionada no posee una expresión resultante analítica. Por lo tanto, a menos que lleves a cabo el procedimiento utilizando una integral numérica, la anterior solución es algo engorrosa.

Ahora, una solución elegante es darse cuenta de que si se consideran dos variables independientes $x$ y $y$, cuyos valores satisfacen una distribución de probabilidad Gaussiana. Además, si se ven las dos variables como las coordenadas en un sistema de coordenadas cartesianas, entonces las variables relacionadas en coordenadas polares1, es decir $R$ y $\Theta$ satisfacen una distribución de probabilidad más conveniente. En concreto, estas dos variables siguen siendo independientes2; además, $\Theta$ sigue una distribución uniforme, integrada a $2\pi$, mientras que $R$ satisface la distribución $f(R)=Re^{-\frac{R^2}{2}}$ que se integra a 1.

Por lo tanto, la importancia de la transformación de coordenadas reside totalmente en el hecho de que ahora TENEMOS una expresión analítica para la integral $f(R)dR$, y el método de Box-Muller puede verse como una consecuencia de esta conveniencia.

Con suerte, esto ayuda a aclarar, hasta cierto punto, la motivación del método para alguien que también estaba buscando una explicación intuitiva como yo. ^^


1. Aquí usamos las letras mayúsculas para mantener la consistencia con las notaciones empleadas en otras respuestas.

2. Esto es intuitivo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X