Supongamos que lanzo un dardo a una diana. Apunto al centro de la diana $(0,0)$ pero no soy muy bueno con los dardos por lo que el dardo cae en una posición aleatoria $(X,Y)$ que tiene una función de densidad conjunta $f:\mathbb R^2\to\mathbb R^+$ .
Hagamos dos suposiciones sobre mi forma de jugar a los dardos.
1. $\qquad$ La densidad es rotacionalmente invariable, por lo que la distribución del lugar donde cae mi dardo sólo depende de la distancia del dardo al centro.
2. $\qquad$ Las variables aleatorias $X$ y $Y$ son independientes, cuánto fallo a izquierda y derecha no influye en la distribución de cuánto fallo arriba y abajo.
Así que por el supuesto uno y Pitágoras debo ser capaz de expresar la densidad $$f(x,y) = g(x^2 + y^2).$$
Ahora como las variables aleatorias $X$ y $Y$ son independientes e idénticamente distribuidos debo ser capaz de expresar $$f(x,y) \propto f(x,0) f(0,y)$$ Combinando estos supuestos obtenemos que para cada par $(x,y)$ tenemos $$g(x^2 + y^2) \propto g(x^2)g(y^2).$$
Esto significa que $g$ debe ser una función exponencial $$g(t) = A e^{-Bt}$$
Así que A será alguna constante normalizadora. B refleja de algún modo las unidades en las que estoy midiendo. (Así, si mido la distancia en cm, B será 10 veces mayor que si la mido en mm). $B$ debe ser negativo porque la densidad debe ser una función decreciente de la distancia (no soy tan malo a los dardos.)
Así que para calcular $A$ Necesito integrar $f(\cdot,\cdot)$ en $\mathbb R^2$ un rápido cambio de coordenadas y $$\iint_{\mathbb R} f(x,y) dxdy = 2\pi\int_0^\infty t g(t) dt = \frac{2\pi}{B^2}. $$ para
Así que debemos establecer $A = \frac{B^2}{2\pi}$ es conveniente elegir $B$ en términos de desviación típica, por lo que fijamos $B = \frac 1{2\sigma}$ y $A = \frac{1}{2\pi\sigma^2}$ .
Así que si pongo $\tilde f(x) = \frac 1{\sqrt{2\pi}\sigma} e^{-\frac{x^2}{2\sigma}}$ entonces $f(x,y) = \tilde f(x) \tilde f(y)$ .
Así que el $e$ viene del hecho de que quería que mi $X$ y $Y$ coordenadas sean independientes y el $\pi$ viene del hecho de que quería invariancia rotacional por lo que estoy integrando sobre un círculo.
Lo interesante ocurre si lanzo dos dardos. Supongamos que lanzo mi primer dardo apuntando a $(0,0)$ que aterriza en $(X_1,Y_1)$ Apunto mi siguiente dardo al primer dardo, así que este cae en $(X_2,Y_2)$ con $X_2 = X_1 + X$ y $Y_2 = Y_1 + Y$ .
Así que la posición del segundo dardo es la suma de los dos errores. Pero mi suma sigue siendo rotacionalmente invariante y las variables $X_2$ y $Y_2$ siguen siendo independientes, por lo que $(X_2,Y_2)$ satisface mis dos suposiciones.
Esto significa que cuando sumo distribuciones normales independientes obtengo otra distribución normal.
Es esta propiedad la que la hace tan útil, porque si tomo la media de una secuencia muy larga de variables aleatorias debería obtener algo con la misma forma independientemente de lo larga que sea mi secuencia y tomar una secuencia el doble de larga es como sumar las dos secuencias. Es esta propiedad de la distribución normal la que la hace tan útil.
PS un factor de dos parece estar mal en mi derivación pero tengo que ir al aeropuerto ahora.