Se trata de un problema interesante. Parece que encontrar una solución analítica para los intervalos de confianza será muy difícil, así que yo intentaría buscar estimaciones razonables.
Yo empezaría por tratar el $\hat p_i$ como muestras i.i.d. de una población con media y varianza desconocidas. Esto le daría intervalos de confianza de $$\hat\mu\pm z\frac{\hat\sigma}{\sqrt n},$$ donde $\hat\mu$ y $\hat\sigma$ son la desviación típica media de la muestra, $n$ es el tamaño de la muestra (su $M$ ) y $z$ es el $z$ -(es decir, para una confianza del 95% de dos caras, $z_{0.05}=1.96$ ).
La precisión de este intervalo de confianza dependerá de la validez de la hipótesis de normalidad implícita. En este caso, hay algunos puntos a su favor:
- El tamaño de la muestra es grande
- Los valores de $\hat p_i$ están limitados por $[0,1]$
- $p_i=0$ más de la mitad del tiempo.
La combinación de estos tres hechos justifica el uso de la hipótesis de normalidad al menos para el intervalo de confianza inferior. Esto se debe a que, el hecho de que $p_i=0$ más de la mitad de las veces implica que la muestra contendrá un gran número de valores con $\hat p_i=0$ por lo que la muestra abarcará toda la cola inferior de la distribución. El supuesto de normalidad suele romperse cuando hay colas muy largas en la distribución de la población que no aparecen en una muestra (atención, no es una afirmación rigurosa). Si además se pudiera garantizar que, digamos $p_i>0.5$ como mínimo $5\%$ del tiempo, entonces estarías seguro en ambos extremos.
Sin embargo, el intervalo de confianza superior podría ser problemático en situaciones en las que la media muestral $\hat\mu$ está muy cerca de $0$ . Consideremos, por ejemplo, el caso extremo en el que todos los $p_i$ son iguales a $0$ excepto uno: $p_1=1$ . En función de la probabilidad $q_1$ asociada a esta bola, podríamos fácilmente tener un caso en el que, con probabilidad, digamos $0.5$ esta bola nunca se extrae durante la muestra, en cuyo caso tendríamos $\hat \mu=0$ pero el intervalo de confianza no sería válido.
Para abordar este caso específico, podemos construir explícitamente un intervalo de confianza cuando la media muestral es $0$ . Si el peso total asignado a las bolas distintas de cero es $q$ podemos ver que la probabilidad de nunca muestrear tal bola es, $(1-q)^M$ y para que la probabilidad sea menor que, digamos $0.05$ debemos tener $q\geq 1-0.05^{1/M}$ .
De ello se deduce que, si $\hat\mu=0$ entonces podemos decir con $95\%$ confianza en que la probabilidad de que una sola ronda del experimento devuelva un valor distinto de cero es, como máximo, de $1-0.05^{1/M}$ lo que significa que, con $95\%$ de confianza, la verdadera media se encuentra en el intervalo $$[0,1-0.05^{1/M}].$$ Para sus constantes específicas, esto daría un intervalo de $[0,0.0003]$ .
Por supuesto, existen escenarios intermedios. Como regla general, si la media muestral $\hat\mu$ está limitada fuera de $0$ entonces los intervalos de confianza estándar deberían ser bastante precisos, y cuanto más se acerquen a $0$ que $\hat\mu$ es, más tienes que preocuparte. Estaría tentado de sugerir algo como $$[\hat\mu- z_\alpha\frac{\hat\sigma}{\sqrt n}, \hat\mu+ z_\alpha\frac{\hat\sigma}{\sqrt n} + 1-\alpha^{1/M}] $$ como un "out-of-the-box" $1-\alpha$ intervalo de confianza, pero sin un examen más detallado, no estoy totalmente seguro de que esto funcione bien en situaciones en las que $\hat\mu$ es pequeño pero distinto de cero.