41 votos

¿Cómo los científicos a averiguar la forma de la distribución normal de probabilidad, función de densidad?

Esta es, probablemente, un aficionado a la pregunta, pero estoy interesado en cómo hicieron los científicos vienen con la forma de la distribución normal de probabilidad, función de densidad? Básicamente lo que me molesta es que para alguien que tal vez sería más intuitiva que la función de probabilidad de una distribución normal de los datos tiene una forma de un triángulo isósceles en lugar de una curva en forma de campana, y cómo se puede demostrar a esa persona que la función de densidad de probabilidad de todos los de una distribución normal de los datos tiene una forma de campana? Por medio de un experimento? O por algunos matemáticos derivación?

Después de todo, ¿qué realmente se considera una distribución normal de los datos? De datos que sigue a la probabilidad patrón de una distribución normal, o algo más?

Básicamente mi pregunta es: ¿por qué la distribución normal de probabilidad, función de densidad tiene una forma de campana y no cualquier otro? Y ¿cómo los científicos a averiguar en que la vida real de los escenarios de la distribución normal se aplicó, por medio de un experimento o estudio de la naturaleza de los datos de varios de la misma?


Por lo que me he encontrado en este enlace para ser realmente útil en la explicación de la derivación de la forma funcional de la curva de distribución normal, y por lo tanto responder a la pregunta "¿por Qué la distribución normal mirar como se hace y no otra cosa?". Realmente alucinante razonamiento, al menos para mí.

44voto

AdamSane Puntos 1825

Parece que asumen en su pregunta que el concepto de la distribución normal fue de alrededor de antes de la distribución fue identificado, y la gente trató de averiguar de qué se trataba. No me queda claro la forma en que funcione. [Edit: hay al menos un sentido que podríamos considerar la existencia de una "búsqueda de una distribución" pero no es "una búsqueda de una distribución que describe un montón y un montón de fenómenos"]

Este no es el caso; la distribución era conocido de antes se llamaba la distribución normal.

¿cómo se puede demostrar a esa persona que la función de densidad de probabilidad de todos los de una distribución normal de los datos tiene una forma de campana

La distribución normal de la función es la cosa que tiene lo que se suele llamar una "forma de campana", todas las distribuciones normales tienen la misma "forma" (en el sentido de que sólo difieren en tamaño y ubicación).

Los datos pueden parecer más o menos "forma de campana" en la distribución, pero que no lo hace normal. Un montón de distribuciones no normales aspecto similar "forma de campana".

La población real de las distribuciones de los datos se han extraído de probablemente nunca realmente normal, aunque a veces es bastante una aproximación razonable.

Esto es generalmente cierto para casi todas las distribuciones que se aplican a las cosas en el mundo real, son modelos, no hechos sobre el mundo. [Por ejemplo, si queremos hacer ciertas suposiciones (los de un proceso de Poisson), podemos derivar la distribución de Poisson -- ampliamente utilizado en la distribución. Pero son esas suposiciones nunca exactamente satisfecho? Generalmente, lo mejor que podemos decir (en la derecha de los casos) es que están muy cerca de la verdad.]

¿qué realmente se considera una distribución normal de los datos? De datos que sigue a la probabilidad patrón de una distribución normal, o algo más?

Sí, en realidad se distribuye normalmente, la población, la muestra fue tomada de tener una distribución que tiene la misma forma funcional de la distribución normal. Como resultado, cualquier población finita no puede ser normal. Las Variables que necesariamente limitada no puede ser normal (por ejemplo, a veces para tareas particulares, las longitudes de las cosas particulares no puede ser negativo, por lo que no puede ser en realidad una distribución normal).

tal vez sería más intuitiva que la función de probabilidad de una distribución normal de los datos tiene una forma de un triángulo isósceles

No veo por qué esto es necesariamente más intuitiva. Es sin duda más sencillo.

Cuando la primera el desarrollo de modelos de distribuciones de error (específicamente para la astronomía en el período temprano), los matemáticos consideran una variedad de formas en relación con el error de distribuciones (incluyendo en un punto temprano de una distribución triangular), pero en gran parte de este trabajo fue la de matemáticas (en lugar de la intuición) que fue utilizado. Laplace miró doble exponencial y distribuciones normales (entre varios otros), por ejemplo. Del mismo modo Gauss utiliza las matemáticas para derivarlo a la misma hora, pero en relación a un conjunto diferente de las consideraciones de Laplace hizo.

En el sentido estrecho que Laplace y Gauss estaban considerando "las distribuciones de los errores", se podría considerar como una "búsqueda de una distribución", al menos por un tiempo. Ambos postulados de algunas de las propiedades de una distribución de los errores que se considera importante (Laplace considerado como una secuencia de algo criterios diferentes a lo largo del tiempo), dirigido a diferentes distribuciones.

Básicamente mi pregunta es: ¿por qué la distribución normal de probabilidad, función de densidad tiene una forma de campana y no cualquier otro?

La forma funcional de la cosa que se llama la densidad normal de la función que le da esa forma. Considere la posibilidad de la normal estándar (por simplicidad; todas las demás normal tiene la misma forma, que sólo difieren en tamaño y ubicación):

$$f_Z(z) = k \cdot e^{-\frac12 z^2};\;-\infty<z<\infty$$

(donde $k$ es simplemente una constante elegida para realizar el área total de 1)

de esta forma se define el valor de la densidad en cada valor de $x$, por lo que es completamente describe la forma de la densidad. Que el objeto matemático es la cosa que adjuntar la etiqueta de "distribución normal". No hay nada especial sobre el nombre; es sólo una etiqueta que se adjunta a la distribución. Ha tenido muchos nombres (y todavía se llama cosas diferentes para diferentes personas).

Mientras que algunas personas han considerado a la distribución normal, como de alguna manera "habitual" es realmente sólo en tipos particulares de situaciones que incluso tienden a verla como una aproximación.


El descubrimiento de la distribución es generalmente acreditado a de Moivre (como una aproximación a la binomial). Él, en efecto, derivado de la forma funcional cuando tratan de aproximar los coeficientes binomiales (/probabilidades binomiales) para aproximar lo contrario tediosos cálculos, pero - mientras lo hace efectivamente se derivan de la forma de la distribución normal - no parece haber pensado acerca de su aproximación como una distribución de probabilidad, aunque algunos autores sugieren que él hizo. Una cierta cantidad de la interpretación es necesaria, así que hay margen para las diferencias en la interpretación.

Gauss y Laplace hizo el trabajo en a principios de la década de 1800; Gauss escribió sobre él en 1809 (en relación con el mismo, siendo la distribución para el que la media es la MLE del centro) y Laplace en 1810, como una aproximación a la distribución de las sumas de simétrica variables aleatorias. Una década más tarde de Laplace da una primera forma de teorema del límite central, discretas y variables continuas.

Primeros nombres para la distribución de incluir la ley de error, la ley de la frecuencia de los errores, y también fue nombrada después de que ambos Laplace y Gauss, a veces conjuntamente.

El término "normal" se utiliza para describir la distribución de forma independiente por tres diferentes autores en la década de 1870 (Peirce, Lexis y Galton), la primera en el año de 1873 y los otros dos en 1877. Esto es más de sesenta años después de la obra de Gauss y Laplace y más del doble que el puesto de Moivre de la aproximación. Galton del uso de era, probablemente, más influyentes, pero él utiliza el término "normal" en relación a ella sólo una vez en 1877 trabajo (sobre todo hablando de "la ley de la desviación").

Sin embargo, en la década de 1880 Galton utiliza el adjetivo "normal" en relación a la distribución en numerosas ocasiones (por ejemplo, como la "curva normal" en 1889), y él a su vez tenía mucha influencia en el posterior estadísticos en el reino unido (especialmente Karl Pearson). Él no dijo por qué se utiliza el término "normal" de esta manera, pero presumiblemente significaba en el sentido de "típica" o "costumbre".

El primer uso explícito de la frase "distribución normal" parece ser por Karl Pearson; ciertamente él lo utiliza en 1894, a pesar de que él afirma haber utilizado mucho antes (una reclamación me iba a ver con gran precaución).


Referencias:

Miller, Jeff
"Más antiguos que se Conocen los Usos de Algunas de las Palabras de las Matemáticas:"
Distribución Normal (Entrada por John Aldrich)
http://jeff560.tripod.com/n.html

Stahl, Saúl (2006),
"La Evolución de la Distribución Normal",
Las Matemáticas De La Revista, Vol. 79, Nº 2 (abril), pp 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf

Distribución Normal, (de 2016, el 1 de agosto).
En Wikipedia, La Enciclopedia Libre.
Recuperado 12:02, el 3 de agosto de 2016, a partir de
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History

Hald, (2007),
"De Moivre la Aproximación Normal a la Binomial, 1733, y Su Generalización",
En: Historia de la Inferencia Estadística Paramétrica de Bernoulli a Fisher, 1713-1935; pp 17-24

[Usted puede notar las discrepancias sustanciales entre estas fuentes en relación a su cuenta de de Moivre]

27voto

Aksakal Puntos 11351

"La Evolución de la Distribución Normal" por SAÚL STAHL es la mejor fuente de información para responder a casi todas las preguntas en tu post. Voy a recitar un par de puntos sólo para su conveniencia, porque usted encontrará la explicación detallada en el papel.

Esta es, probablemente, un aficionado a la pregunta

No, es una pregunta interesante para cualquier persona que utiliza las estadísticas, porque esto no está cubierto en detalle en cualquier lugar en los cursos estándar.

Básicamente lo que me molesta es que para alguien que tal vez sería más intuitiva que la función de probabilidad de una distribución normal de los datos tiene una forma de un triángulo isósceles en lugar de una curva en forma de campana, y cómo se puede demostrar a esa persona que la función de densidad de probabilidad de todos los de una distribución normal de los datos tiene una forma de campana?

Miren esta imagen de la hoja de papel. Muestra las curvas de error que Simpson ocurrió antes de la Gaussiana (Normal) fue descubierto para analizar los datos experimentales. Así, su intuición es irregular.

enter image description here

Por medio de un experimento?

Sí, por eso fueron llamadas "curvas de error". El experimento fue que las mediciones astronómicas. Los astrónomos luchado con los errores de medición durante siglos.

O por algunos matemáticos derivación?

De nuevo, ¡SÍ! Larga historia corta: el análisis de los errores en los datos astronómicos led de Gauss para su (aka Normal) de distribución. Estos son los supuestos que se utilizó:

enter image description here

Por el camino, Laplace utilizar un par de diferentes enfoques, y también vino con su distribución demasiado mientras se trabaja con datos astronómicos:

enter image description here

Por qué de la distribución normal se muestra en el experimento como errores de medición, he aquí un típico "de la mano-ondulado" explicación físico que se utilizan para dar (una cita de Gerhard Bohm, Günter Zac, Introducción a la Estadística y los Datos Análisis de los Físicos p.85):

Muchas de las señales experimentales seguir para una muy buena aproximación normal de distribución. Esto es debido al hecho de que se componen de la suma de muchas de las contribuciones y una consecuencia del teorema del límite central.

11voto

Learner Puntos 123

La "normal" de distribución se define a ser de distribución en particular.

La pregunta es ¿por qué habríamos de esperar que esta distribución particular a ser común en la naturaleza, y por qué es tan a menudo se utiliza como una aproximación, incluso cuando los datos reales no se siga exactamente esa distribución? (Datos reales se encuentran a menudo para tener una "cola de grasa", es decir, valores muy lejos de la media son mucho más comunes de lo que la distribución normal podría predecir).

Para decirlo de otra manera, lo que es especial acerca de la distribución normal?

La normal tiene un montón de "agradable" propiedades estadísticas, (ver, por ejemplo, https://en.wikipedia.org/wiki/Central_limit_theorem), pero el dato más relevante de la OMI es el hecho de que es la "máxima entropía" de la función para cualquier distribución con una media y la varianza. https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution

Para expresar esto en el lenguaje ordinario, si sólo se da la media (punto central) y la varianza (ancho) de una distribución, y usted asume nada en absoluto acerca de él, usted se verá obligado a dibujar una distribución normal. Cualquier otra cosa que requiera información adicional (en el sentido de Shannon teoría de la información), por ejemplo, la asimetría, a determinar.

El principio de máxima entropía fue introducido por E. T. Jaynes como una forma de determinar razonable de los priores de la inferencia Bayesiana, y creo que él fue el primero en llamar la atención a esta propiedad.

Ver esto para una mayor discusión: http://www.inf.fu-berlin.de/inst/ag-ki/rojas_home/documents/tutorials/Gaussian-distribution.pdf

3voto

user126665 Puntos 31

La Distribución Normal (también conocido como "Distribución de Gauss") tiene una sólida base matemática. El Teorema del Límite Central dice que si usted tiene un conjunto finito de n independientes e idénticamente distribuidas al azar variables que tienen un específico de la media y la varianza, y se toma la media de las variables aleatorias, la distribución del resultado converge a una Distribución Gaussiana como n tiende a infinito. No hay conjeturas aquí, desde la derivación matemática conduce a esta específica función de distribución y no de otra.

Para poner esto en términos más tangibles, considere la posibilidad de una sola variable aleatoria, como lanzar una moneda buena (2 resultados igualmente posibles). Las probabilidades de obtener un resultado en particular es de 1/2 para los jefes y 1/2 de colas.

Si aumenta el número de monedas y mantener un registro del número total de cabezas obtenidos con cada prueba, entonces usted va a obtener una Distribución Binomial, que tiene aproximadamente la forma de campana. Sólo gráfico con el número de cabezas a lo largo del eje x, y el número de veces que se da la vuelta que muchas cabezas a lo largo del eje.

El más monedas que usted use, y las más veces le da la vuelta a las monedas, el más cerca de la gráfica se ven a mirar como una curva en forma de campana de Gauss. Eso es lo que el Teorema del Límite Central afirma.

Lo increíble es que el teorema no depende de cómo las variables aleatorias son distribuidos, tan largo como cada una de las variables aleatorias tiene la misma distribución. Una idea clave en el teorema es que usted está agregando o promedio de las variables aleatorias. Otro concepto clave es que el teorema es la descripción matemática de limitar el número de variables aleatorias se hace más grande y más grande. El más variables que utiliza, el más cerca de la distribución de la aproximación de la Distribución Normal.

Te recomiendo tomar una clase de Estadística Matemática si quieres ver cómo los matemáticos determinó que la Distribución Normal es en realidad el matemáticamente correcta de la función de la curva de bell.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X