1 votos

Cómo decidir la convergencia de la media del conjunto en un proceso de Monte Carlo

Estoy simulando la dispersión electromagnética de una superficie rugosa. El proceso habitual es hacer una simulación de Monte Carlo, que se describe brevemente como sigue.

  • Generar una superficie rugosa al azar, y calcular la intensidad del campo lejano disperso en una dirección particular de interés.
  • Repite este proceso para varios casos diferentes de superficies rugosas y obtén una media de conjunto de la intensidad de campo lejano.

Este promedio de conjunto converge después de que se hayan tomado suficientes instancias. Entonces, mi pregunta es: ¿cómo se puede determinar de forma rigurosa si se ha producido la convergencia? En la comunidad de la dispersión electromagnética, esta cuestión no se aborda, y en su lugar se utilizan estimaciones heurísticas (por ejemplo, "utilizamos 100 instancias").

Gracias apriori.

1voto

Ryan Ginstrom Puntos 8354

¿Tiene acceso a la desviación estándar? Si es así, la coeficiente de variación es una buena medida de convergencia: desviación estándar/media. Una generalización es el desviación media cuadrática . Esas páginas de la wikipedia también indican cómo manejar, hasta cierto punto, las situaciones en las que la media es cercana a cero.

1voto

heathrow Puntos 25

En este problema, se tiene una cantidad de valor real que tiene una distribución desconocida, y se quiere estimar el error en la media a partir del promedio de N extracciones independientes. Esta es una aplicación del teorema del límite central.

Si eliges $N$ selecciones independientes de una distribución $\rho(x)$ con media cero y segundo momento finito, lo que significa que

$$ \int x^2 \rho(x) = \sigma^2$$

A continuación, suma los picos para obtener $X$ , se obtiene que la suma se distribuye como el $N$ -convolución doble de $\rho$ con ella misma. Esto eventualmente converge a una gaussiana de segundo momento $N\sigma^2$ . Esto significa que el error de tomar una media sobre $N$ pasos es la anchura de la distribución de $X/N$ que es

$$ {\sqrt{N\sigma^2}\over N} = {\sigma\over \sqrt{N}}$$

En otras palabras, el error tiene una distribución gaussiana con una anchura que cae como la raíz cuadrada del número de ensayos. Su error es el $\sigma$ de la distribución dividida por la raíz cuadrada del número de ensayos.

Si sus pruebas le dan $x_1,x_2,...,x_N$ para x, se calcula la media de éstas y se llama x:

$$ x = {\sum_i x_i \over N}$$

A continuación, calcule el cuadrado medio de $(x_i-x)$ para obtener una mejor estimación de $\sigma$

$$ \sigma^2 = {\sum_i (x_i - x)^2 \over N} $$

Entonces su error es $\sigma/\sqrt{N}$ . Esta es la mejor estimación que se puede hacer en sus circunstancias.

Lo único que hay que comprobar es la convergencia a una gaussiana. Esto significa que te aseguras de que el modelo de rugosidad da una distribución de intensidades donde el $sigma$ no está dominado por eventos raros, de modo que la estimación de N ensayos de $\sigma$ es fiable. En principio, se podría tener un modelo de superficie rugosa artificial que produjera cosas ridículas en muy raras ocasiones: por ejemplo, supongamos que la rugosidad conspira ocasionalmente en largas distancias para ser una sinusoide casi exactamente periódica. Esto hace que la superficie sea una rejilla de difracción, con picos extremadamente agudos en ciertas direcciones. Si se mira la dirección en la que se produce el pico de difracción, se obtiene un enorme valor atípico en la intensidad dispersa para una configuración de rejilla de difracción, y esto podría ocurrir en muy pocos ensayos, por lo que el pico podría no aparecer nunca en su limitado número de ensayos.

En la práctica, sólo tienes que asegurarte de que tu modelo de rugosidad no es conspirativo (para hacer rejillas periódicas) y para ello suele ser suficiente (aparte de la conspiración de rugosidad no local) comprobar que la distribución de intensidades no tiene una cola de ley de potencia. No se puede hacer nada riguroso sin una descripción del modelo de rugosidad, de modo que se pueda demostrar que las conspiraciones de las rejillas de difracción no ocurren con ninguna probabilidad razonable, de modo que el segundo momento está bien descrito por lo que se ve.

Esto suele ser cierto, en ausencia de un fenómeno de cola obvio (por ejemplo, se ven 2 ensayos de 200 que dominan la varianza), por lo que hacer un análisis de error del teorema central del límite es suficiente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X