Digamos que estoy en el negocio de muestreo de la distribución normal estándar. Y vamos a pasar por alto punto flotante cuestiones y otras imprecisiones numéricas para el momento. Decir quiero ser perezoso y en lugar de un dibujo exacto de la muestra de la distribución normal solo me dan los primeros 3 dígitos más allá del punto decimal a la derecha. Después de que acabo de añadir de manera uniforme dígitos al azar. A mí me parece que el número aleatorio estoy de muestreo en esto de la moda seguirá siendo bastante cerca distribuidos normalmente. Pero ¿en qué sentido? ¿Qué tipo de declaración formal se podría hacer aquí?
Respuesta
¿Demasiados anuncios?Deje $\hat Z$ denotar el número de que su intervención se genera a partir de $Z\sim\text{Normal}(0,1)$ mediante la sustitución de todos los dígitos después de la milésimas lugar por una secuencia de iid uniforme dígitos. Por lo tanto,
$$\hat Z =\begin{cases}Z-10^{-3}\{10^3Z\}+10^{-3}U &\text{if } Z\ge 0\\[2ex]
Z+10^{-3}\{10^3|Z|\}-10^{-3}U &\text{if } Z<0,
\end{casos}$$
donde $U\sim\text{Uniform}(0,1)$ (independiente de $Z$) y $\{x\}=x-\lfloor x\rfloor$ denota la parte fraccionaria de cualquier real $x$.
A continuación, el error producido por el procedimiento de ser
$\newcommand{\sgn}{\operatorname{sgn}}$
$$\text{err}:=\hat Z-Z=10^{-3}\left(U-\{10^{3}|Z|\}\right)\sgn(Z),$$
así
$$|\text{err}|=10^{-3}\left|U-\{10^{3}\,|Z|\}\right|.$$
Ahora para cualquier $\sigma>0$,
$$\begin{align}\Pr\left( \{|\sigma Z|\} \le x \right)
&=\sum\limits_{k=0}^\infty\Pr\left(-k-x< \sigma Z \le -k \right)
+\sum\limits_{k=0}^\infty\Pr\left(k< \sigma Z \le k+x \right)\\
&=2\,\sum\limits_{k=0}^\infty\Pr\left(k< \sigma Z \le k+x \right)\\
&=2\,\sum\limits_{k=0}^\infty{\large(}\Pr\left(\sigma Z \le k+x \right)-\Pr\left(\sigma Z \le k\right){\large)}\\
\end{align}$$
y la diferenciación para obtener la densidad de probabilidad ...
$$\begin{align}f_{\{|\sigma Z|\}}(x)
&=2\,\sum\limits_{k=0}^\infty f_{\sigma Z}\left({k+x}\right),
\end{align}$$
donde $f_{\sigma Z}(x)={1\over\sigma\sqrt{ 2\pi}}\exp(-{1\over 2}({x\over\sigma})^2)$. Por el trazado de esta función de densidad de $0<x<1$, se encontró que cuando la $\sigma\ge 1$,
$$\left|f_{\{|\sigma Z|\}}(x)-1\right| <{1\over 2\sigma}$$
así que para $\sigma=10^3$, la distribución de $\{|\sigma Z|\}$ es efectivamente $\text{Uniform}(0,1)$. Además de que el trazado de la función actual como en el anterior, los siguientes son los resultados de la simulación con $10^7$ muestras de:
EDIT: he publicado una prueba de que, como $\sigma\to\infty$, $f_{\{|\sigma Z|\}}(x) = 1+O(\sigma^{-1}),\ 0<x<1;$ más precisamente, $$f_{\{|\sigma Z|\}}(x) = 1+{1\over\sigma\sqrt{2\pi}}(1-2x) + O(\sigma^{-2}),\quad 0<x<1.$$
En consecuencia, $$|\text{err}| \aprox 10^{-3}\left|U-U'\right|= T $$ donde $T$ tiene un $\text{Triangular}(a=0,b=10^{-3},c=0)$ distribución.
Siguientes son los resultados de la simulación usando $\sigma=10^3$ $10^7$ muestras de:
PD: Mi mensaje original se dieron cuenta de que la fórmula para $\hat Z$ depende de si $Z$ es positivo o negativo. Una consecuencia de esto más complicada fórmula es que la transformada de Fourier de la densidad ya no simplifica como antes, haciendo más difícil para analizar el comportamiento como $\sigma\to\infty.$ (de Ahí el recurso a que el trazado de la densidad en lugar de una fórmula que podría mostrar el enfoque a la uniformidad.)