En este problema, se tiene una cantidad de valor real que tiene una distribución desconocida, y se quiere estimar el error en la media a partir del promedio de N extracciones independientes. Esta es una aplicación del teorema del límite central.
Si eliges $N$ selecciones independientes de una distribución $\rho(x)$ con media cero y segundo momento finito, lo que significa que
$$ \int x^2 \rho(x) = \sigma^2$$
A continuación, suma los picos para obtener $X$ , se obtiene que la suma se distribuye como el $N$ -convolución doble de $\rho$ con ella misma. Esto eventualmente converge a una gaussiana de segundo momento $N\sigma^2$ . Esto significa que el error de tomar una media sobre $N$ pasos es la anchura de la distribución de $X/N$ que es
$$ {\sqrt{N\sigma^2}\over N} = {\sigma\over \sqrt{N}}$$
En otras palabras, el error tiene una distribución gaussiana con una anchura que cae como la raíz cuadrada del número de ensayos. Su error es el $\sigma$ de la distribución dividida por la raíz cuadrada del número de ensayos.
Si sus pruebas le dan $x_1,x_2,...,x_N$ para x, se calcula la media de éstas y se llama x:
$$ x = {\sum_i x_i \over N}$$
A continuación, calcule el cuadrado medio de $(x_i-x)$ para obtener una mejor estimación de $\sigma$
$$ \sigma^2 = {\sum_i (x_i - x)^2 \over N} $$
Entonces su error es $\sigma/\sqrt{N}$ . Esta es la mejor estimación que se puede hacer en sus circunstancias.
Lo único que hay que comprobar es la convergencia a una gaussiana. Esto significa que te aseguras de que el modelo de rugosidad da una distribución de intensidades donde el $sigma$ no está dominado por eventos raros, de modo que la estimación de N ensayos de $\sigma$ es fiable. En principio, se podría tener un modelo de superficie rugosa artificial que produjera cosas ridículas en muy raras ocasiones: por ejemplo, supongamos que la rugosidad conspira ocasionalmente en largas distancias para ser una sinusoide casi exactamente periódica. Esto hace que la superficie sea una rejilla de difracción, con picos extremadamente agudos en ciertas direcciones. Si se mira la dirección en la que se produce el pico de difracción, se obtiene un enorme valor atípico en la intensidad dispersa para una configuración de rejilla de difracción, y esto podría ocurrir en muy pocos ensayos, por lo que el pico podría no aparecer nunca en su limitado número de ensayos.
En la práctica, sólo tienes que asegurarte de que tu modelo de rugosidad no es conspirativo (para hacer rejillas periódicas) y para ello suele ser suficiente (aparte de la conspiración de rugosidad no local) comprobar que la distribución de intensidades no tiene una cola de ley de potencia. No se puede hacer nada riguroso sin una descripción del modelo de rugosidad, de modo que se pueda demostrar que las conspiraciones de las rejillas de difracción no ocurren con ninguna probabilidad razonable, de modo que el segundo momento está bien descrito por lo que se ve.
Esto suele ser cierto, en ausencia de un fenómeno de cola obvio (por ejemplo, se ven 2 ensayos de 200 que dominan la varianza), por lo que hacer un análisis de error del teorema central del límite es suficiente.