Dadas variables aleatorias independientes pero no idénticas $X_1, X_2, \ldots ,X_n$ con $E[X_i]=0,$ $E[X_i^2]=\sigma_i^2=1$ y terceros momentos absolutos finitos $\rho_i=E[|X_i|^3].$ Dejemos que $$S_n = {\sum_{i=1}^n X_i}$$ con cdf $F_n.$ Entonces, a partir del teorema de Berry_Esseen podemos acotar el error en la estimación de $F_n$ con una aproximación normal: $$\left|F_n(x) - \Phi \left( {{x} \over {\sqrt{n}}} \right) \right| \leq 0.56 \sum_{i=1}^n \rho_i,$$ donde $\Phi(x)$ es la cdf normal estándar. [Lo anterior está ligeramente modificado de la Wikipedia].
Ahora supongamos que el $X_i$ son discretos, tomando valores enteros. En la práctica, aplicaríamos una corrección de continuidad a la aproximación, utilizando $$F_n(x) \approx \Phi \left( { { {{x+{{1} \over {2}}}} } \over {\sqrt{n}}} \right).$$
La corrección de la continuidad está destinada a proporcionar una mayor precisión. ¿Puede cuantificarse esto? Es decir, ¿existe una desigualdad de Berry-Esseen de la forma $$\left| F_n(x) - \Phi \left( { { {{x+ {{1} \over {2}}}} } \over {\sqrt{n}}} \right) \right| \leq k \sum_{i=1}^n \rho_i \ \ ?$$
2 votos
La corrección de continuidad es no aplicada en la forma en que usted lo ha expuesto. Refleje que $\Phi(x+\frac 12)$ puede ser bastante diferente de $\Phi(x)$ demasiado para ser una corrección de "continuidad".
0 votos
Intentaré reafirmarlo.
0 votos
He editado el enunciado del problema ahora.
2 votos
No entiendo de dónde viene esta corrección de la continuidad. ¿Por qué es " $x+1/2$ " que se prefiere en el argumento de $\Phi$ en lugar de " $x$ "? Espero que su respuesta muestre claramente por qué " $x-1/2$ " no funcionaría igual de bien. Ten en cuenta que este último sería el valor que utilizarías si negaras todos los datos. ¿Pero por qué negar los datos cambiaría la calidad de la aproximación? Al fin y al cabo, $-X$ tiene todas las propiedades que se le suponen a $X$ , así que lo que es bueno para $X$ debería ser bueno para $-X$ ¡!
0 votos
Estamos tratando de aproximar la cdf de una variable aleatoria discreta con la cdf de una continua. Así que tiene sentido mover o asignar alguna probabilidad que esté dentro de una vecindad del punto de dominio discreto $x$ a $x.$ Prueba esto: Mira la convolución de 3 variables aleatorias uniformes discretas IID en $[-2,2].$ Un ajuste de la fdc normal utilizando $x$ como argumento tiene un error absoluto máximo de 0,0825 en $x=-1.$ Utilizando $x-{{1} \over {2}}$ tiene un error absoluto máximo de 0,1569 en $x = 0.$ Utilizando $x+{{1} \over {2}}$ tiene un error absoluto máximo de 0,0099 en ambos $x=-2$ y $x = 1.$