6 votos

Barras de error en el registro de grandes números

Estoy calculando una cantidad de la siguiente forma:

$\mu = \log( \frac{1}{n} \sum_{i=1}^{n} e^{\phi(X_i)} )$

a través de MC. $X_i$ son iid y puedo probar. Quiero dar las barras de error\ intervalo de confianza en $\mu$.

Un método es realizar una aproximación normal a la suma, obtener barras de error en la suma y de transformación mediante el logaritmo, así:

$ \mu \in ( \log(\mu - 2\sigma) , \log( \mu + 2\sigma) )$,

donde $\sigma$ es la ets de $e^{\mu}$. Es esta una cosa razonable de hacer? Hay una manera mejor?

Utilizando la anterior hay otro problema. $\phi(X_i)$ podría llegar a ser tan grande hasta el punto de que $e^{2\phi(X_i)}$ desbordamientos. Esto hace que sumar el cuadrado para el cálculo de las barras de error imposible. El método con el que tengo que calcular la varianza no parece importar:

$\sigma^2 = \frac{1}{n}[ \bar{ x^2 } - \bar{x}^2]$

es tan malo como

$\sigma^2 = \frac{1}{n}[\frac{1}{n}\sum (x_i - \bar{x})^2]$ ($x_i$ no $X_i$)

dado que en este escenario la media de la muestra es pequeño en comparación con el mayor valor alcanzado (esto podría implicar la aproximación normal es injustificado, pero todavía me gustaría tener alguna medida de la bondad de mi estimación).

Una posible solución que he considerado es tomar una de "las grandes desviaciones" y solamente se considera el más importante (más grande) ejemplo:

$\sigma = \sqrt{\frac{1}{n}[\frac{1}{n}\sum (x_i - \bar{x})^2]} = \frac{1}{n} \sqrt{\sum (x_i - \bar{x})^2} \approx \frac{1}{n} \max_i(x_i) - \bar{x})$

que en mi caso iba a dar:

$\sigma \approx \frac{1}{n} [\max_i(e^{\phi(X_i)}) - e^{\mu}]$

Me gustaría saber si alguien tiene una solución mejor.

4voto

jldugger Puntos 7490

El problema no es tan profunda como puede parecer. Porque

$$\frac{1}{n} \sum_{i=1}^{n} e^{\phi(X_i)} = e^Y\frac{1}{n} \sum_{i=1}^{n} e^{\phi(X_i)-Y} $$

para

$$Y = \max_i\{\phi(X_i)\},$$

un algebraicamente la expresión equivalente es

$$\mu = Y -\log n + \log \sum_{i=1}^{n} e^{\phi(X_i)-Y}. $$

En este no habrá dificultades de computación en el registro de la suma, que necesariamente se encuentra entre el $1$ $n$ (ya que todos los exponentes son no positivos). En particular, no hay ninguna posibilidad de desbordamiento y cualquier subdesbordamiento será absorbida (alta precisión) en la suma, donde en la mayoría de las $\log_2 n$ bits será perdido (y casi seguro que la pérdida en la precisión será de menos de alrededor de $ \frac{1}{2}\log_2 n$ bits). Si usted tiene alguna preocupación acerca de la precisión de las pérdidas, la suma de los términos en orden ascendente de $\phi(X_i)$.

El mismo enfoque se aplica al cálculo de los momentos necesarios para obtener un estimado de la desviación estándar.

El uso de una aproximación normal puede ser imprudente , a menos que esté seguro de que todas las $\exp(\phi(X_i))$ estará bien dentro de un orden de magnitud de cada uno de los otros (lo que significa que el $\phi(X_i)$ se encuentran dentro de un intervalo de alrededor de $2$ o menos). Incluso entonces usted puede ser que necesite una bastante grande, el valor de $n$. Si sólo algunos de los valores de dominar a los demás, entonces el promedio-que justifica esta aproximación no se producirá, sin importar el tamaño de $n$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X