Hay muchas maneras de mirar este problema. Creo que puede ser dividido en un par de preguntas diferentes, pero relacionadas:
- ¿Por qué muchas cosas aparecen aproximadamente normal? Por ejemplo altura humana que no está normalmente distribuida, pero aún así parece bien aproximada por una distribución normal.
- ¿El CLT en realidad se aplican a la mayoría del mundo real de las distribuciones?
- Qué es tan especial acerca de máxima entropía de las distribuciones de todos modos?
Voy a intentar responder a estas preguntas. Vamos a empezar con 3. Hay diferentes escuelas de pensamiento de la probabilidad; la subjetiva interpretación dice que las distribuciones son más que un reflejo de nuestras creencias o de incertidumbre en algo. Si digo que estoy pensando en un número entero entre 1 y 10 y pedirle que adivinar lo que es, su grado de creencia en cuanto a qué número es, podría ser, por ejemplo, una distribución uniforme. Dado que usted no sabe nada acerca de ello, la distribución uniforme sería la mejor opción (le daría a usted la más alta probabilidad de estar en lo correcto). Sin embargo, usted puede aprovechar el hecho de que los seres humanos no son buenos generadores de números aleatorios, y así una distribución que pesa 5 o 6 mayor que 1 podría darle una mejor oportunidad de ganar. El punto de todo esto es que las distribuciones (según el subjetivismo) representan el grado de su creencia, y nada más.
Como sucede, la distribución con la máxima entropía dado su conocimiento acerca de algo es el que le da la mayor probabilidad de estar en lo correcto. Y si usted no sabe nada más acerca de algunos de medición/número de la excepción que sigue estas reglas:
- Es un número real.
- Es no acotada desde abajo o desde arriba.
- Tiene un valor promedio.
- Tiene un cierto grado de variación en torno a este valor promedio.
A continuación, la distribución que le da la mayor probabilidad de ser derecho es la distribución normal. Un montón de tiempo, incluso se puede relajar algunos de estos supuestos. Por ejemplo, si es limitada, pero los límites son mucho más grandes que la varianza (estatura y peso serían buenos ejemplos aquí), el resultado máximo de la entropía de la distribución podría ser un trunca normal de distribución, que se ve bastante cercana a una distribución normal.
Lo que nos lleva a la pregunta 1. ¿Por qué tantas distribuciones que no son normales todavía aparecen aproximadamente normal? Por ejemplo, la de Cauchy, Weibull, t de Student, y la log-normal de las distribuciones de toda la mirada aproximadamente normal, para ciertos valores de los parámetros.
La mejor explicación que puedo pensar es que todos ellos son de la máxima entropía de distribución dado que algunas limitaciones, y las limitaciones son a menudo similares a las limitaciones que dan a la distribución normal, por lo que sus formas pueden terminar siendo similar a la distribución normal.
Tenga en cuenta que sólo estas pocas distribuciones en conjunto abarcan una amplia gama de sistemas. Por ejemplo, el CLT dice que si usted tiene un montón de diferentes tipos de variables aleatorias independientes y se suma a ellos, se puede conseguir algo que parece normal. Pero si en lugar de sumar, multiplicar , se obtiene la log-normal! Lo que sí se ve 'muy cerca' de lo normal, especialmente si sólo hubiera una muestra de algunas medidas a seguir.
Ahora, finalmente, a la pregunta 2. Como otros han señalado, la CLT no parecen aplicarse a una gran cantidad de problemas del mundo real, pero que en realidad no es tan importante. Incluso si algunos de los supuestos de la CLT se relajó un poco, las distribuciones resultantes todavía a salir en busca de lo normal. Por ejemplo, incluso si las variables aleatorias que se suman son completamente independientes, la suma puede acudir en busca de lo normal, siempre hay algún grado de aleatoriedad o incertidumbre en las variables aleatorias. Este es ciertamente el caso de los humanos altura - los genes que controlan la altura, todos tienen muy inter-relacionados con los efectos. Pero el resultado todavía sale un aspecto muy cercano a lo normal.