89 votos

¿Cómo se ha obtenido la distribución normal?

Abraham de Moivre, cuando ideó esta fórmula, tuvo que asegurarse de que los puntos de inflexión estuvieran exactamente a una desviación típica del centro, y para que tuviera forma de campana, así como asegurarse de que el área bajo la curva fuera exactamente igual a uno.

Y de alguna manera llegaron a la distribución normal estándar, que es la siguiente:

$$\displaystyle\phi(x) = \frac{1}{\sqrt{2\pi}}e^{-\dfrac{1}{2}x^2}$$

Y aún más genial, encontró la distribución para cuando la media no era $0$ y la desviación típica no era $1$ y se me ocurrió:

$$\displaystyle f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\dfrac{(x - \mu)^2}{2\sigma^2}}$$

Y lo que pregunto es, ¿cómo? ¿Cómo se llegó a una ecuación que se ajustara a todos los criterios mencionados? Por otra parte, ¿cómo los números $\pi$ y $e$ entrar en esto?

80voto

Tim Puntos 3803

Supongamos que lanzo un dardo a una diana. Apunto al centro de la diana $(0,0)$ pero no soy muy bueno con los dardos por lo que el dardo cae en una posición aleatoria $(X,Y)$ que tiene una función de densidad conjunta $f:\mathbb R^2\to\mathbb R^+$ .

Hagamos dos suposiciones sobre mi forma de jugar a los dardos.

1. $\qquad$ La densidad es rotacionalmente invariable, por lo que la distribución del lugar donde cae mi dardo sólo depende de la distancia del dardo al centro.

2. $\qquad$ Las variables aleatorias $X$ y $Y$ son independientes, cuánto fallo a izquierda y derecha no influye en la distribución de cuánto fallo arriba y abajo.

Así que por el supuesto uno y Pitágoras debo ser capaz de expresar la densidad $$f(x,y) = g(x^2 + y^2).$$

Ahora como las variables aleatorias $X$ y $Y$ son independientes e idénticamente distribuidos debo ser capaz de expresar $$f(x,y) \propto f(x,0) f(0,y)$$ Combinando estos supuestos obtenemos que para cada par $(x,y)$ tenemos $$g(x^2 + y^2) \propto g(x^2)g(y^2).$$

Esto significa que $g$ debe ser una función exponencial $$g(t) = A e^{-Bt}$$

Así que A será alguna constante normalizadora. B refleja de algún modo las unidades en las que estoy midiendo. (Así, si mido la distancia en cm, B será 10 veces mayor que si la mido en mm). $B$ debe ser negativo porque la densidad debe ser una función decreciente de la distancia (no soy tan malo a los dardos.)

Así que para calcular $A$ Necesito integrar $f(\cdot,\cdot)$ en $\mathbb R^2$ un rápido cambio de coordenadas y $$\iint_{\mathbb R} f(x,y) dxdy = 2\pi\int_0^\infty t g(t) dt = \frac{2\pi}{B^2}. $$ para

Así que debemos establecer $A = \frac{B^2}{2\pi}$ es conveniente elegir $B$ en términos de desviación típica, por lo que fijamos $B = \frac 1{2\sigma}$ y $A = \frac{1}{2\pi\sigma^2}$ .

Así que si pongo $\tilde f(x) = \frac 1{\sqrt{2\pi}\sigma} e^{-\frac{x^2}{2\sigma}}$ entonces $f(x,y) = \tilde f(x) \tilde f(y)$ .

Así que el $e$ viene del hecho de que quería que mi $X$ y $Y$ coordenadas sean independientes y el $\pi$ viene del hecho de que quería invariancia rotacional por lo que estoy integrando sobre un círculo.

Lo interesante ocurre si lanzo dos dardos. Supongamos que lanzo mi primer dardo apuntando a $(0,0)$ que aterriza en $(X_1,Y_1)$ Apunto mi siguiente dardo al primer dardo, así que este cae en $(X_2,Y_2)$ con $X_2 = X_1 + X$ y $Y_2 = Y_1 + Y$ .

Así que la posición del segundo dardo es la suma de los dos errores. Pero mi suma sigue siendo rotacionalmente invariante y las variables $X_2$ y $Y_2$ siguen siendo independientes, por lo que $(X_2,Y_2)$ satisface mis dos suposiciones.

Esto significa que cuando sumo distribuciones normales independientes obtengo otra distribución normal.

Es esta propiedad la que la hace tan útil, porque si tomo la media de una secuencia muy larga de variables aleatorias debería obtener algo con la misma forma independientemente de lo larga que sea mi secuencia y tomar una secuencia el doble de larga es como sumar las dos secuencias. Es esta propiedad de la distribución normal la que la hace tan útil.

PS un factor de dos parece estar mal en mi derivación pero tengo que ir al aeropuerto ahora.

6voto

AK11 Puntos 11

Son preguntas muy antiguas. Pero aún así, hay una muy interesante enlace donde puedes encontrar la derivación de la función de densidad de la distribución Normal. Esto ayudará a entender la construcción de la función de densidad de probabilidad de la distribución Normal de una manera más lúcida.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X