He leído innumerables páginas en google y no encuentro una respuesta satisfactoria. También he leído http://castatistics.wikispaces.com/file/view/normal+der..pdf pero dudo que esa fuera la motivación original de la función gaussiana. Actualmente soy estudiante y mi libro de texto sólo me dice que la función f(x) = a e -(x - b)^2/c se utiliza como función de densidad de probabilidad para una curva normal. Pero mi libro de texto no me da ninguna pista sobre el origen de esta función. ¿Cuál fue la motivación original para el desarrollo de dicha función? ¿Puede alguien ofrecer una prueba que pueda entender con pasos claramente marcados? Tengo conocimientos de cálculo básico y soy un principiante en lo que respecta a la estadística. Por favor, nada de pruebas complicadas.
Respuestas
¿Demasiados anuncios?La derivación original procede de De Moivre, que la utilizó como aproximación a la binomial. Posteriormente se derivó de forma independiente varias veces en otros contextos.
http://en.wikipedia.org/wiki/Abraham_de_Moivre#Probability
http://en.wikipedia.org/wiki/De_Moivre%E2%80%93Laplace_theorem
La distribución normal es la que se espera cuando las mediciones se componen de un gran número de componentes de "ruido" que se distribuyen de la misma manera entre sí.
El principio se ilustra a veces con un ejemplo en el que se utilizan dados. Lanza un dado un gran número de veces y traza la distribución de los valores. Suponiendo que el dado sea justo, se obtendrá una distribución uniforme (discreta) del 1 al 6. Ahora hazlo de nuevo, pero utiliza dos dados. Obtendrás una distribución triangular escalonada del 2 al 12. Añade un tercer dado y la distribución tiene un poco de forma de campana y los pasos son pequeños porque ahora hay 17 valores posibles diferentes. Con cuatro dados la distribución se parece mucho a una distribución normal, y con un número infinito de dados es una distribución normal. Se necesitan entre cuatro y un número infinito de dados (yo suelo decir 12) para que la distribución sea, a efectos prácticos, indistinguible de la distribución normal dada por la fórmula normal.
Muchas mediciones biológicas y físicas tienen muchas fuentes de inexactitud y ruido, por lo que las distribuciones de esas mediciones serán aproximadamente normales, siempre que las distribuciones de esos componentes sean similares. Si uno de los componentes del ruido es mucho mayor que los demás, no se obtendrá una distribución normal. Imagínese que un dado de un conjunto de docenas tuviera las caras marcadas de 100 a 600 en lugar de 1 a 6. Ese dado dominaría a los otros once y, por tanto, la distribución de la suma de sus caras superiores sería una mezcla obvia de uniforme (discreto) de 100 a 600 y una casi continua casi normal de 11 a 66. Las distribuciones de las variaciones de los componentes tienen que ser similares, aunque no es necesario que sean normales (ni siquiera tienen que ser casi normales si hay muchas).
(Merece la pena señalar que muchas fuentes de variabilidad tienen una distribución logarítmica, por lo que muchas mediciones en biología y física son más casi log-normales que normales).