Estoy haciendo algunos numérico experimento que consiste en el muestreo de una distribución lognormal $X\sim\mathcal{LN}(\mu, \sigma)$, y tratando de estimar los momentos $\mathbb{E}[X^n]$ a través de dos métodos:
- Mirando a la media de la muestra de la $X^n$
- La estimación de $\mu$ $\sigma^2$ utilizando el ejemplo de los medios de $\log(X), \log^2(X)$, y a continuación, utilizando el hecho de que para una distribución logarítmico-normal, tenemos $\mathbb{E}[X^n]=\exp(n \mu + (n \sigma)^2/2)$.
La pregunta es:
Me parece experimentalmente que el segundo método se realiza mucho mejor que la primera, cuando yo tenga el número de muestras fijadas, y aumentar el $\mu, \sigma^2$ por algún factor T. hay una simple explicación para este hecho?
Estoy adjuntando una figura en la cual el eje de las x es T, mientras que el eje y son los valores de $\mathbb{E}[X^2]$ comparando los verdaderos valores de $\mathbb{E}[X^2] = \exp(2 \mu + 2 \sigma^2)$ (línea naranja), a los valores estimados. método 1 - puntos de color azul, el método de 2 puntos verdes. eje y en escala logarítmica
EDITAR:
A continuación es de un mínimo de código de Mathematica para producir los resultados para una T, con la salida de:
ClearAll[n,numIterations,sigma,mu,totalTime,data,rmomentFromMuSigma,rmomentSample,rmomentSample]
(* Define variables *)
n=2; numIterations = 10^4; sigma = 0.5; mu=0.1; totalTime = 200;
(* Create log normal data*)
data=RandomVariate[LogNormalDistribution[mu*totalTime,sigma*Sqrt[totalTime]],numIterations];
(* the moment by theory:*)
rmomentTheory = Exp[(n*mu+(n*sigma)^2/2)*totalTime];
(*Calculate directly: *)
rmomentSample = Mean[data^n];
(*Calculate through estimated mu and sigma *)
muNumerical = Mean[Log[data]]; (*numerical \[Mu] (gaussian mean) *)
sigmaSqrNumerical = Mean[Log[data]^2]-(muNumerical)^2; (* numerical gaussian variance *)
rmomentFromMuSigma = Exp[ muNumerical*n + (n ^2sigmaSqrNumerical)/2];
(*output*)
Log@{rmomentTheory, rmomentSample,rmomentFromMuSigma}
Salida:
(*Log of {analytic, sample mean of r^2, using mu and sigma} *)
{140., 91.8953, 137.519}
anteriormente, el segundo resultado es la media de la muestra de $r^2$, que está por debajo de los otros dos resultados