26 votos

¿La suma de variables aleatorias lognormales independientes parece lognormal?

Intento comprender por qué la suma de dos (o más) variables aleatorias lognormales se aproxima a una distribución lognormal a medida que aumenta el número de observaciones. He buscado en internet y no he encontrado ningún resultado al respecto.

Es evidente que si $X$ y $Y$ son variables lognormales independientes, entonces por propiedades de los exponentes y variables aleatorias gaussianas, $X \times Y$ también es lognormal. Sin embargo, no hay ninguna razón para sugerir que $X+Y$ también es lognormal.

SIN EMBARGO

Si generas dos variables aleatorias lognormales independientes $X$ y $Y$ y que $Z=X+Y$ y repetir este proceso muchas veces, la distribución de $Z$ parece lognormal. Incluso parece acercarse más a una distribución lognormal a medida que aumenta el número de observaciones.

Por ejemplo: Después de generar 1 millón de pares, la distribución de los logaritmo natural de Z se muestra en el histograma siguiente. Se asemeja claramente a una distribución normal, lo que sugiere que $Z$ es efectivamente lognormal.

enter image description here

¿Alguien tiene alguna idea o referencias a textos que puedan ser útiles para entender esto?

37voto

AdamSane Puntos 1825

Esta lognormalidad aproximada de las sumas de lognormales es una regla empírica bien conocida; se menciona en numerosos artículos, y en varias entradas de este sitio.

Una aproximación lognormal para una suma de lognormales igualando los dos primeros momentos se denomina a veces aproximación de Fenton-Wilkinson.

Puede resultarle útil este documento de Dufresne (disponible en ici o ici ).

También en el pasado he señalado a veces a la gente el documento de Mitchell

Mitchell, R.L. (1968),
"Permanencia de la distribución log-normal".
J. Sociedad Óptica de América . 58: 1267-1272.

Pero eso ya está cubierto en las referencias de Dufresne.

Pero aunque se cumple en un conjunto bastante amplio de casos no demasiado sesgados, no se cumple en general, ni siquiera para lognormales i.i.d., ni siquiera como $n$ se hace bastante grande.

He aquí un histograma de 1000 valores simulados, cada uno el logaritmo de la suma de cincuenta mil lognormales i.i.d:

histogram of sum of fifty thousand lognormals

Como ves... el logaritmo está bastante sesgado, por lo que la suma no se acerca mucho a la lognormal.

De hecho, este ejemplo también valdría como ejemplo útil para la gente que piensa (debido al teorema del límite central) que algunos $n$ en los cientos o miles darán medias muy cercanas a la normalidad; ésta es tan asimétrica que su logaritmo está considerablemente sesgado a la derecha, pero la límite central no obstante, el teorema $n$ de muchos millones* antes de que empiece a parecerse en algo a la simetría.

* No he intentado calcular cuántos pero, por la forma en que se comporta la asimetría de las sumas (equivalentemente, las medias), unos pocos millones serán claramente insuficientes


Dado que se solicitaron más detalles en los comentarios, puede obtener un resultado similar al del ejemplo con el siguiente código, que produce 1.000 réplicas de la suma de 50.000 variables aleatorias lognormales con parámetro de escala $\mu=0$ y el parámetro de forma $\sigma=4$ :

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

(Desde entonces he probado $n=10^6$ . Su registro es todavía fuertemente sesgada a la derecha)

2voto

Ivan Svetunkov Puntos 26

Probablemente sea demasiado tarde, pero he encontrado el siguiente artículo sobre las sumas de distribuciones lognormales que trata el tema. No es lognormal, sino algo bastante diferente y difícil de trabajar.

2voto

victor Puntos 21

La ley lognormal está ampliamente presente en los fenómenos físicos, las sumas de este tipo de distribuciones de variables son necesarias por ejemplo para estudiar cualquier comportamiento escalar de un sistema. Conozco este artículo (muy largo y muy fuerte, ¡el principio se puede entender si no eres especialista!), "Broad distribution effects in sums of lognormal random variables" publicado en 2003, (the European Physical Journal B-Condensed Matter and Complex Systems 32, 513) y está disponible https://arxiv.org/pdf/physics/0211065.pdf .

1voto

Kernloffland Puntos 10

El informe de Dufresne de 2009 y este uno de 2004 junto con este útil documento cubrir la historia sobre las aproximaciones de la suma de la distribución log-normal y da resultado matemático suma.

El problema es que todas las aproximaciones allí citadas se encuentran suponiendo desde la partida que se está en un caso en el que la suma de distribuciones log-normales sigue siendo log-normal. Entonces se puede calcular la $\mu$ y el $\sigma$ de la suma global de alguna manera aproximada. Pero esto no te da las condiciones que tienes que cumplir si quieres que la suma siga siendo log-normal.

Tal vez [este papel] ( http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348 ) te dan en un caso particular una especie de teorema del límite central para la suma de log-normales pero sigue faltando generalidad. De todas formas el ejemplo dado por Glen_b no es realmente apropiado, porque es un caso en el que puedes aplicar fácilmente el teorema del límite central clásico, y por supuesto en ese caso la suma de log-normales es gaussiana.

Pero es cierto, como se dice en el artículo citado más arriba, que incluso en el límite $n\to \infty$ puede tener una suma logarítmica normal (por ejemplo, si las variables están correlacionadas o suficientemente no i.i.d. )

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X