Tengo una variable aleatoria $Z$ que toma valores en los números enteros no negativos $\{ 0,1,2,\dots \}$, llamar a las probabilidades de cada resultado $z_k:=P[Z=k]$. Puedo probar de $Z$'s de distribución de forma independiente y barato; actualmente tengo un tamaño de muestra de $2^{28}$. Parece que $z_0\approx 0.24, z_1\approx 0.18,\dots$, con alrededor de decaimiento exponencial.
Tengo una secuencia de formas cuadráticas con coeficientes positivos:
- $Q_0(z_0) = \frac14 z_0^2$
- $Q_1(z_0,z_1) = \frac 12 {z_0 z_1}$
- ...
- $Q_7(z_0,z_1,\dots,z_7) = \frac{1}{8} \left(2 z_0 z_1+3 z_2 z_1+4 z_4 z_1+4 z_6 z_1+3 z_0 z_3 + \right.$ $\qquad\qquad\qquad\qquad\qquad\qquad \a la izquierda. +4 z_2 z_3+4 z_3 z_4+4 z_0 z_5+4 z_2 z_5+4 z_0 z_7\right)$
- ...
Lo que me gustaría tener es un intervalo de confianza para la $Q_i$'s que está a menos de $10^{-4}$ amplia, pero voy a tomar todo lo que se puede conseguir.
He rigurosos límites en las $z_i$, y dado que los coeficientes de las $Q$'s son todas positivas, es sencillo para convertirlas en riguroso de los límites de la $Q$'s. Pero no sé cómo hacer esto correctamente con los intervalos de confianza.
¿Qué es esto? He encontrado un extraño fenómeno en la teoría de números, y sé cómo demostrar que realmente sucede, pero en realidad se requiere un poco de programación de esfuerzo por mi parte y una cantidad considerable de tiempo en nuestro local de clúster. Antes de invertir ese tiempo y obstruir nuestra máquina, me gustaría ser más seguro que estoy de que el fenómeno es real.
Quiero cuantificar la razonabilidad de mi afirmación de que $Q_7<Q_6$$Q_7<Q_8$. Mis estimaciones indican que $Q_6-Q_7$ es de alrededor de $5\cdot 10^{-4}$, que es la razón por la que yo quería CIs en esa resolución.
Revisión de un gran número entero $n$, y deje $A$ ser de manera uniforme un subconjunto elegido de $\{1,2,\dots,n\}$ (es decir, cada subconjunto particular ha probabilidad de $2^{-n}$ de ser elegido). Deje $Q_k(n)$ la probabilidad de que exactamente $k$ de los números de $\{2,3,\dots,2n\}$ no puede ser escrito como la suma de dos elementos de $A$; deje $Q_k = \lim_n Q_k(n)$. Es un poco difícil de demostrar, pero esos límites existen y $\sum_{k} Q_k =1$. Ahora no es ninguna sorpresa que $Q_0$ es pequeña, y como $k$ aumenta el $Q_k$ aumenta, tiene un pico y luego decae exponencialmente. El extraño de todo es que hay un sesgo en contra de la 7. Es decir, experimentalmente $Q_7< Q_6$$Q_7<Q_8$. Que es, lo que no fue una sorpresa, en realidad no es cierto: la distribución es bimodal.
De lo que puedo expresar el $Q_i$'s (usando la teoría) como arriba, sin el límite en términos de esta distribución, que se define por la $z_i$'s. Eso es útil porque tengo una forma rigurosamente obligado el $z_i$'s usando, como he mencionado anteriormente, algunos cálculos de gran tamaño. También, tengo un conjunto de datos muy grande para el $Z$ variable.