Su 90% de confianza se acerca bastante a 2SD (que en realidad coincide mejor con el 95% de confianza, pero olvidémoslo). A efectos de estimar la probabilidad de un único resultado, una única ronda es un ensayo Bernoulli. Digamos que la probabilidad real del resultado A es $p$ . Sea $X$ sea la variable aleatoria que cuenta cuántas veces el resultado $A$ ocurrió en $N$ rondas de simulación. El valor esperado de $X$ es entonces $E(X)=Np$ . La varianza de $X$ es $\sigma^2=Np(1-p)$ . Por lo tanto $\pm$ 2SD-intervalo de $X$ tiene semiancho $ 2\sigma=2\sqrt{Np(1-p)}. $ Cuando estimamos $p$ con $X/N$ el error 2SD sería entonces $$\Delta p=\frac{2\sigma}{N}=\frac{2\sqrt{p(1-p)}}{\sqrt{N}}.$$ Usted pidió $\Delta p<10^{-5}$ así que quieres $$ \sqrt{N}>2\cdot10^5\sqrt{p(1-p)}\Longleftrightarrow N>4\cdot10^{10}p(1-p). $$ Después de haber realizado un número suficiente de rondas de simulación, tendrá una idea bastante aproximada del valor de $p(1-p)$ por lo que puedes utilizar la fórmula anterior.
Esta fórmula tiene probablemente algunas inexactitudes, pero para grandes $N$ es de esperar que sean insignificantes.
Ya ves que para obtener una estimación tan exacta de una probabilidad mediante ensayos de Bernoulli se necesita un gran número de ellos. En un trabajo anterior, cuando hacía simulaciones de codificación de canales, utilizábamos una cifra aproximada que requería $X>200$ antes de detener una simulación. Se podría confiar en que esto diera una cifra significativa para $p$ . Nos interesaba sobre todo $\log_{10}p$ con un margen de error del tipo $\pm 0.1$ así que más o menos :-)