Por definición, una variable aleatoria X tiene una distribución log-normal desplazada con desplazamiento $\theta$ si log(X + $\theta$ ) ~ N( $\mu$ , $\sigma$ ).
En la notación más habitual, correspondería a una lognormal con desplazamiento $-\theta$ .
Sin embargo, si X + $\theta$ ~logN( $\mu$ , $\sigma$ ), entonces también X tiene una distribución log-normal X ~logN( $\mu'$ , $\sigma'$ ).
No es el caso, como veremos.
Para mantener las cosas claras, distingamos entre la lognormal de dos parámetros (con parámetros $\mu$ y $\sigma^2$ ) y una lognormal desplazada (es decir, de tres parámetros) ( $\delta,\mu,\sigma^2$ ); si $\delta=0$ obtenemos la lognormal de dos parámetros como caso especial. La densidad para la lognormal de tres parámetros es:
$$\frac {_1}{^{(x-\delta)\sigma {\sqrt {2\pi }}}}\, e^{-{\frac{1}{2\sigma ^{2}} {\left(\ln (x-\delta)-\mu \right)^{2}}}},\quad x>\delta, \:\delta,\mu\in \mathbb{R},\,\sigma>0$$
[Aquí un positivo $\delta$ aumenta en $\delta$ correspondiente al negativo de su $\theta$ un positivo $\theta$ corresponde a un desplazamiento hacia abajo de $\theta$ . Me quedo con la convención más común].
Si ya existe un desplazamiento (parámetro de ubicación) en el modelo, añadir un parámetro de desplazamiento no serviría de nada. Por ejemplo, $\mu$ desempeña este papel en la distribución normal, por lo que no tendría sentido añadir un parámetro de desplazamiento a un normal distribución; simplemente se combinaría con la $\mu$ plazo.
Sin embargo, en el lognormal, $\mu$ no es un parámetro de desplazamiento. Es un parámetro de escala; estira y comprime en lugar de desplazar. Por su parte, $\sigma$ es un parámetro de forma, que controla el grado de asimetría/colas pesadas de la distribución lognormal.
Una forma rápida de ver que el parámetro de desplazamiento hace algo diferente a los dos parámetros que ya están allí (suponiendo que no desea seguir a través de las manipulaciones algebraicas en la densidad), es utilizar el hecho de que el logaritmo de cualquier dos se distribuye como una normal (la lognormal de tres parámetros no comparte esta propiedad en general, como veremos).
Con la normal, si aplicamos un desplazamiento movemos la densidad hacia arriba o hacia abajo a lo largo del eje x, lo que simplemente altera su $\mu$ parámetro y nos deja con otro normal. Con la lognormal de dos parámetros, alterando el $\mu$ nos deja con otra lognormal de dos parámetros pero no simplemente desplazar los valores. Tiene la propiedad de que si luego tomamos los logaritmos, volvemos a una normal. Desplazar la normal y luego exponenciar a una lognormal de dos parámetros es diferente de desplazar la lognormal de dos parámetros.
[El problema se reduce al hecho de que la suma y la exponenciación no son conmutativas, por lo que desplazar la lognormal no funciona como desplazar la normal].
Podemos ver inmediatamente que si suministramos un desplazamiento negativo ( $\delta<0$ en una lognormal de tres parámetros) que no podemos tomar logaritmos para volver a una normal -- parte de la densidad se aplica a valores negativos de $x$ . Podríamos considerar brevemente la idea de que los argumentos positivos podrían funcionar de alguna manera, pero podemos determinar fácilmente que no puede ser el caso a través de la simulación, o más directamente, incluso sólo considerando el límite inferior:
El logaritmo de una variante lognormal de tres parámetros con $\delta>0$ tendrá un valor lo más pequeño posible de $\ln \delta$ por lo que no puede ser normal, ya que todas las variantes normales abarcan toda la recta real.
Alternativamente, en una simulación, los pasos son:
-
generar datos a partir de una distribución normal con $\mu,\sigma$
-
exponenciar, a una lognormal de dos parámetros correspondiente con los mismos parámetros
-
desplazar la distribución hacia arriba en una cantidad sustancial (digamos, el doble de la media de la lognormal), de modo que tenga un claro impacto en la localización
-
tomar los registros y observar que el resultado no es claramente normal.
Para una muestra grande de una normal estándar y un parámetro de desplazamiento de $\delta=2e^\frac12\approx 3.3$ obtenemos:
Estos histogramas son los que obtenemos en los pasos 1 y 4 respectivamente.
Podemos ver claramente que no obtenemos un back out normal (está sesgado, para empezar), por lo que el parámetro shift no está haciendo lo mismo que cambiar $\mu$ lo haría*. El valor más bajo del $\log(x)$ que se muestra a la derecha, es $1.19498$ justo por encima del límite inferior de $\frac12+\log(2)\approx 1.19315$
* en realidad podemos ver que de nuevo en la fórmula para la densidad, donde $\delta$ está dentro del $\log(x..)$ parte pero $\mu$ está fuera de ella, por lo que claramente no se suman.
Apéndice:
#R code for the above (fewer simulations than I did, but enough)
#
z <- rnorm(1000000,0,1) # 1 million normals
delta <- 2*exp(1/2)
y <- exp(z) # 2-parameter lognormal
x <- y + delta # shifted (i.e. 3-parameter) lognormal
par(mfrow=c(1,2))
hist(z,n=200,col="skyblue",bord="skyblue",freq=FALSE)
hist(log(x),n=200,col="lightgreen",bord="lightgreen",xlim=c(1,5),freq=FALSE)