9 votos

La distribución Normal y monótona de las transformaciones

He oído que un montón de las cantidades que se producen en la naturaleza están distribuidos normalmente. Normalmente, esto se justifica mediante el teorema central del límite, que dice que cuando el promedio de un gran número de variables aleatorias iid, se obtiene una distribución normal. Así, por ejemplo, un rasgo que está determinado por el efecto aditivo de un gran número de genes puede ser de aproximadamente una distribución normal, ya que el gen es posible que los valores se comportan aproximadamente como variables aleatorias iid.

Ahora, lo que me confunde es que la propiedad de ser distribuido normalmente está claro que no es invariante bajo transformaciones monotónicas. Por lo tanto, si hay dos maneras de medir algo que están relacionados por una transformación monotónica, es poco probable que ambos se distribuye normalmente (a menos que monotónica transformación es lineal). Por ejemplo, podemos medir los tamaños de las gotas de lluvia por diámetro, por área de superficie o volumen. Asumiendo formas similares para todas las gotas de lluvia, el área de la superficie es proporcional al cuadrado del diámetro, y el volumen es proporcional al cubo del diámetro. Así que todas estas formas de medición no puede ser distribuido normalmente.

Así que mi pregunta es si la forma particular de la escala (es decir, la elección de transformación monotónica) en virtud de la cual la distribución no es normal, debe llevar consigo un significado físico. Por ejemplo, en caso de alturas de una distribución normal o el cuadrado de la altura, o el logaritmo de la altura, o la raíz cuadrada de la altura? Hay una manera de responder a esa pregunta por la comprensión de los procesos que afectan a la altura?

6voto

ESRogs Puntos 1381

Simplemente CLT (ni cualquier otro teorema) no indica que cada cantidad en el universo está normalmente distribuida. De hecho, los estadísticos utilizan a menudo monótona de las transformaciones para mejorar la normalidad, por lo que podrían utilizar sus herramientas favoritas.

4voto

David Pokluda Puntos 4284

Creo que missunderstood (medio de) el uso estadístico de hacer de la distribución normal, pero me gusta tu pregunta.

No creo que es una buena idea para asumir de manera sistemática la normalidad y tengo que admitir que es hecho en algún momento (tal vez debido a que la distribución normal es manejable, unimodal ...) sin verificación. Por lo tanto tu comentario acerca de la monótona mapa es excelente !

Sin embargo, el poderoso, el uso de la normalidad viene cuando se construye a sí mismo nuevas estadísticas, tales como el que aparece cuando se aplica el empiriral contador de parte de la expectativa: el empírico significa. Por lo tanto empírica media y más en general de suavizado es lo que hace a la normalidad aparecen por doquier...

1voto

AdamSane Puntos 1825

Tanto una variable aleatoria y muchas de las transformaciones de la que puede ser aproximadamente normal; de hecho, si la variación es pequeña en comparación con la media, puede ser que una muy amplia variedad de transformaciones aspecto bastante normal.

> a<-rgamma(10000,1000,1000)
> hist(a)
> hist(1/a)
> hist(a^2)
> hist(a^(3/2))

4 histograms showing near-normality

(haga clic para una versión más grande)

0voto

BBlake Puntos 310

La modificación de la escala de una variable en particular debe, cuando sea posible, se refieren a algunos comprensible escala por la razón de que ayuda a hacer que el modelo resultante de interpretar. Sin embargo, la transformación resultante no necesita absolutamente realizar un significado físico. Esencialmente, usted tendrá que participar en un trade off entre la violación de la normalidad asunción y la interpretabilidad del modelo. Lo que me gusta hacer en estas situaciones es tener los datos originales, los datos transformados en una forma que tenga sentido, y los datos transformados en una forma que es más normal. Si los datos transformados en una forma que tiene sentido es el mismo que el de los resultados cuando los datos se transforman en una manera que hace que sea más normal, me informe de ello en una forma que es interpretable con una nota de lado que los resultados son los mismos en el caso de la forma óptima transformado (y/o no transformados) de datos. Cuando los datos sin transformar se está comportando bastante mal, llevo a cabo mi análisis con los datos transformados, pero hago mi mejor esfuerzo para informar de los resultados no transformadas en unidades.

También, creo que tienes un concepto erróneo en su declaración de que "las cantidades que se producen en la naturaleza están distribuidos normalmente". Esto sólo es cierto en los casos donde el valor es determinado por el efecto aditivo de un gran número" de factores independientes. Que es, significa y de las sumas están distribuidos normalmente, independientemente de la distribución subyacente de los que sacan, donde como valores individuales no se espera que sea distribuido normalmente. Como era de ejemplo, el individuo se basa en una distribución binomial no se ven del todo normal, pero con una distribución de las sumas de 30 basa en una distribución binomial tiene un aspecto bastante normal.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X