8 votos

¿Ventaja de múltiples simulaciones en antigua Monte Carlo?

El espíritu de esta pregunta viene de "Ordinario de Monte Carlo", también conocido como "la vieja usanza de Monte Carlo"

Supongamos que tengo una variable aleatoria $X$, con
$$\mu := E[X]\\ \sigma^2:=Var[X] $$

Ambos son valores desconocidos, debido a que la función de distribución de probabilidad de $X$ es desconocido (o los cálculos son insolubles).

De cualquier manera, supongamos que de alguna manera se puede simular $n$ dibuja $X_1,X_2,\dots,X_n$ (estos son independientes e idénticamente distribuidas) de la distribución de $X$. Vamos a definir los parámetros de la muestra

$$ \hat{\mu}_n := \frac{1}{n}\sum_{i=1}^{n}X_i\\ \hat{\sigma}_n^2 : = \frac{1}{n}\sum_{i=1}^{n}(X_i-\hat{\mu}_n)^2 $$

De acuerdo con el Teorema del Límite Central, como $n$ se hace muy grande, la media de la muestra $\hat{\mu}_n$ va estrechamente obedecen a una distribución normal

$$ \hat{\mu} \sim N(\mu\frac{\sigma^2}{n}) $$

Antes de que podamos calcular los intervalos de confianza, el autor afirma que, dado que no conocemos $\sigma^2$, vamos a hacer la estimación de que $\sigma^2 \approx \hat{\sigma}^2$, o más precisamente de una estimación insesgada $\sigma^2 \approx \frac{n}{n-1}\hat{\sigma}^2$, y se puede proceder a partir de ahí el uso de técnicas estándar.

Ahora, mientras el autor menciona la importancia de la $n$ suficientemente grande (número de sorteos por simulación), no hay ninguna mención sobre el número de simulaciones y su efecto en la confianza.

Hay alguna ventaja de ejecución $k$ simulaciones (realizando $n$ atrae cada vez) para obtener varias muestras de medios de $\hat{\mu}_{n,1}, \hat{\mu}_{n,2}, \dots \hat{\mu}_{n,k}$, y, a continuación, utilizar los medios de los medios para mejorar nuestra estima y la confianza con respecto a lo desconocido $\mu,\sigma$$X$?

O ¿basta dibujar $n$ de las muestras de $X$ en una sola simulación, como $n$ es lo suficientemente grande?

5voto

C.S.Cameron Puntos 908

Mientras los problemas respecto a la generación de números pseudoaleatorios son evitarse (ver nota al final), los dos enfoques ($k$ simulaciones con $n$ dibuja vs simulación solo con suficientemente grande $n$) son equivalentes con respecto a la estimación de la media. Con respecto a la memoria, se observa que en el $k$ simulaciones caso, usted necesita para almacenar la muestra de medios de $\hat{\mu}_{n,1}, \dots, \hat{\mu}_{n,k}$ antes de la realización de la final de la media, mientras que esto no ocurre en la simulación solo escenario. Con las computadoras modernas, la realización de una sola simulación con suficientemente grande $n$ no debe ser más difícil que lo que se ha descrito anteriormente y, de hecho, debería ahorrar tiempo.

La razón matemática, más allá de la equivalencia es la linealidad. Para ser más precisos, en la $k$ simulaciones de escenarios, se debe calcular la "final" de la media de la muestra $\hat{\mu}$ como sigue $$ \hat{\mu} = \frac{1}{k} \sum_{h=1}^k \hat{\mu}_{n,h} = \frac{1}{k} \sum_{h=1}^k \frac{1}{n} \sum_{i=1}^n X^{(h)}_i = \frac{1}{nk} \sum_{h=1}^k \sum_{i=1}^n X^{(h)}_i $$ donde $X_i^{(h)}$ denota el sorteo numeradas $i$ en la simulación $h$. Este ordening es arbitraria si nada extraño sucede, por lo tanto puede volver a la etiqueta de cada una de las $X_i^{(h)}$ con un índice nuevo, decir $m=1,\dots,nk$, la obtención de $$ \hat{\mu} = \frac{1}{nk} \sum_{m=1}^{nk} X_m $$ Pero esto es equivalente a realizar una simulación solo con $nk$ sorteos (obviamente, los sorteos deben ser yo.yo.d., como ya se comentó).

Nota: los Posibles problemas con la PRNGs se describen en la página de la Wikipedia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X