7 votos

¿De dónde procede la distribución aleatoria gaussiana?

Estoy estudiando una introducción a la probabilidad, y antes de la explicación del Teorema Central del Límite el autor presenta la Distribución Normal Gaussiana.

Tiene una fórmula compleja y poco intuitiva, aunque es muy importante en el campo de la Probabilidad. ¿ Se encontró la distribución gaussiana antes de la deducción de la CLT ? ¿Cómo se descubrió esta distribución? ¿Y cuáles son las propiedades que la hacen tan especial?

2 votos

Buena(s) pregunta(s) y no quiero ser descortés, pero a veces una simple búsqueda en Google seguramente le dará lo que busca.

2 votos

La entrada de Wikipedia para la distribución Normal incluye una sección de Historia. es.wikipedia.org/wiki/Distribución_normal#Historia

4voto

Yves Daoust Puntos 30126

Quiero comentar "Tiene una fórmula compleja y poco intuitiva".

Veamos primero la ecuación reducida,

$$p(x)\propto e^{-x^2/2}.$$

Esto es simplemente el exponencial de un cuadrado, nada realmente difícil. El coeficiente $2$ sirve como factor de escala para garantizar que la desviación típica sea $1$ . (No daré aquí los detalles técnicos, ya que se trata de integrales impropias).

Ahora tenemos que normalizar la función para que el área bajo la curva sea $1$ y la fórmula final es

$$p(x)=\frac1{\sqrt{2\pi}}e^{-x^2/2}.$$

Si consideramos la media general $\mu$ y desviación típica $\sigma$ la fórmula se adapta simplemente aplicando la transformación lineal $x\to(x-\mu)/\sigma$ que cambia $\mu$ a $0$ y reescala $\sigma$ a $1$ . Para garantizar que la zona siga siendo $1$ el factor de normalización debe multiplicarse por $\sigma$ para compensar. Tenemos

$$p(x)=\frac1{\sqrt{2\pi}\sigma}e^{-(x-\mu)/2\sigma^2}.$$

Si nos fijamos en la forma de la función, es muy suave, es simétrica, tiene un único máximo y decae rápidamente a ambos lados. Este comportamiento describe una variable aleatoria que permanece "concentrada" en torno a la media.

enter image description here


Para comprender mejor la forma, se pueden observar las distribuciones de las sumas de $n$ variables aleatorias uniformes en el intervalo $0,1$ para aumentar $n$ :

enter image description here

Está suavizando y alisando la curva, que converge rápidamente a una gaussiana.

Ahora observe que con $x+y=z$ donde $x,y$ siguen una gaussiana reducida

$$\int_{-\infty}^\infty e^{-x^2/2}e^{-y^2/2}dx=\int_{-\infty}^\infty e^{-x^2/2}e^{-(z-x)^2/2}dx=\int_{-\infty}^\infty e^{-(x-z/2)^2/2-z^2/4}dx \\=e^{-z^2/4}\int_{-\infty}^\infty e^{-x^2/2}dx\propto e^{-z^2/4}.$$

Esto demuestra que la distribución de la suma de dos gaussianas es otra gaussiana, con varianza $2$ . Mediante un argumento más complicado (basado en la transformada de Fourier de las convoluciones), se puede demostrar lo contrario: una distribución aditiva debe ser gaussiana.

0 votos

¿Una distribución aditiva debe ser gaussiana? Sospecho que has olvidado algunos supuestos.

0 votos

@J.G.: por supuesto, esta es la "versión corta".

0 votos

¿Dónde puedo encontrar la "versión completa"?

1voto

Tim Almond Puntos 1887

En cuanto a la cuestión histórica, se "descubrió" a partir de un intento de averiguar qué distribución debería tener una media muestral, y hubo algunas salidas en falso por el camino, pero lo dejaré ahí porque esto no es HSM.

La distribución gaussiana no es que no es intuitivo, si lo miras de la manera correcta. Si el log-pdf tiene una serie de Taylor y expandimos alrededor de la moda (que se puede tomar como $0$ tras una traslación), el término de orden más bajo que puede sobrevivir es un $x^2/2!$ plazo. La integral $\int_\mathbb{R}\exp -x^2/2\, \text{d}x$ se obtuvo a finales del siglo XVIII (la prueba que todo el mundo conoce hoy en día tardó un poco más; los primeros argumentos, aunque válidos, no eran tan breves ni limpios), y no fue mucho más difícil verificar que la FDP proporcional a $\exp -x^2/2$ es de varianza $1$ que es una buena normalización. La fórmula "compleja" que estás pensando es sólo una generalización lineal, a saber. $f(x)\mapsto \tfrac{1}{\sigma}f(\tfrac{x-\mu }{\sigma})$ . Por supuesto, esto es un poco más ordenado si se trabaja primero con CDFs, a saber. $F(x)\mapsto F(\tfrac{x-\mu }{\sigma})$ .

Hay varias razones por las que las distribuciones gaussianas pueden surgir de forma natural, además del CLT. Éstas se discuten en mis respuestas y en las de otros aquí . Mi respuesta, en particular, analiza varios problemas para los que una gaussiana es la solución única u óptima.

1voto

pete Puntos 1

Propiedades especiales y características:

  • Si $X$ tiene una distribución normal, entonces también la tiene $aX+b$ donde $a,b$ son constantes con $a\neq0$ .

  • Si $X$ y $Y$ tienen una distribución normal conjunta, entonces $X+Y$ .

Tenga en cuenta que $X_n$ y $Y_n$ son secuencias de variables aleatorias que tienden a gaussianas $X$ y $Y$ cuando $n\to\infty$ en la base de CLT - también $X_n+Y_n$ tenderá a una gausiana $Z$ de modo que $X+Y=Z$ donde el LHS es una suma de Gaussianas. Esto explica por qué una suma de gaussianas es de nuevo una gaussiana, y nos dice por qué la distribución gaussiana es la única "candidata" para la CLT.

Del mismo modo $aX_n$ tenderá a una gaussiana, lo que implica que $aX$ vuelve a ser gaussiano.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X