Dada una moneda con probabilidad de cara $\lambda$ , muestrear la probabilidad $f(\lambda)$ . Esto se denomina Fábrica de Bernoulli problema, y sólo ciertas funciones $f$ puede ser simulada de esta manera. Otro interés es simulación exacta que sólo puede lograrse con algoritmos que empleen únicamente aritmética racional y números de precisión arbitraria.
Más concretamente, las funciones $f$ que me importa son continuos y polinómicamente acotados, y el mapa $[0, 1]$ a $[0, 1]$ .
Una función $f(x)$ es acotado polinomialmente si ambos $f$ y $1-f$ están limitados por debajo por min( $x^n$ , $(1-x)^n$ ) para algún número entero $n$ (Keane y O'Brien 1994). Esto implica que $f$ no admite raíces en (0, 1).
Hay dos algoritmos (uno de Thomas y Blanchet 2012, otro de atuszyski et al.) para simular una función de este tipo mediante dos secuencias de polinomios que convergen por arriba y por abajo a dicha función. A grandes rasgos, los algoritmos funcionan como sigue:
- Generar U, un número aleatorio uniforme en $[0, 1]$ .
- Tirar la moneda de entrada (con probabilidad de cara) $\lambda$ ), y luego construir un límite superior e inferior para $f(\lambda)$ basado en los resultados de los giros hasta ahora. En este caso, estos límites provienen de dos grados $n$ polinomios que se acercan a $f$ como $n$ se hace grande, donde $n$ es el número de lanzamientos de monedas hasta el momento en el algoritmo.
- Si U es menor o igual que el límite inferior, devuelve 1. Si U es mayor que el límite superior, devuelve 0. En caso contrario, ir al paso 2.
El resultado del algoritmo es 1 con probabilidad exactamente igual a $f(\lambda)$ o 0 en caso contrario.
Pero, por desgracia, ninguno de los dos documentos describe con suficiente detalle el proceso de polinomios necesario para que el algoritmo funcione.
Por eso pregunto lo siguiente.
-
¿Existen resultados que describan cómo calcular los coeficientes de Bernstein para dos secuencias de polinomios que convergen por arriba y por abajo a una función específica $f$ de la manera descrita en el Declaración formal que se da a continuación? A grandes rasgos
- los polinomios de cada secuencia deben tener coeficientes de Bernstein situados en [0, 1], y ser de grado creciente; y
- el grado $n$ los coeficientes de los polinomios deben estar en o "dentro" de los del polinomio superior anterior y del inferior anterior, una vez que los polinomios son elevados al grado $n$ (el "requisito de coherencia"; Nacu y Peres 2005).
El ritmo de convergencia puede depender de $\lambda$ y cada secuencia puede comenzar más cerca de la función en algún $\lambda$ que en otros (véase la figura 2 de Thomas y Blanchet 2012, por ejemplo). El requisito de coherencia implica que las dos secuencias "aumenten" o "disminuyan" a $f$ . Véase a continuación una declaración más formal.
-
Por las razones expuestas en la nota 3 que figura a continuación: Dado un $C^2$ función continua, ¿existen algoritmos prácticos para construir polinomios que converjan a esa función de manera Declaración formal y donde el número esperado de lanzamientos de la moneda es finito? Un ejemplo es la función $\min(2\lambda,1-\epsilon)$ en el dominio $(0, 1/2-\epsilon)$ que figura en Nacu y Peres 2005.
Declaración formal:
Más formalmente, para los esquemas de aproximación que busco, existen dos secuencias de polinomios, a saber-
- $g_{n}(\lambda): =\sum_{k=0}^{n}a(n, k){n \choose k}\lambda^{k}(1-\lambda)^{n-k}$ y
- $h_{n}(\lambda): =\sum_{k=0}^{n}b(n, k){n \choose k}\lambda^{k}(1-\lambda)^{n-k}$ ,
para cada número entero $n\ge1$ tal que
- $0\le a(n, k)\le b(n, k)\le1$ ,
- $\lim_{n}g_{n}(\lambda)=\lim_{n}h_{n}(\lambda)=f(\lambda)$ por cada $\lambda\in[0,1]$ y
- $g_{m}\preceq_{n}g_{n}$ y $h_{n}\preceq_{n}h_{m}$ por cada $m<n$ (el requisito de coherencia),
donde $f(\lambda)$ es continua en $[0, 1]$ (Nacu y Peres 2005; Holtz et al. 2011), y el objetivo es encontrar los valores adecuados para $a(n, k)$ y $b(n, k)$ . (Por Teorema de Dini , $(g_n)$ y $(h_n)$ convergerá uniformemente, no sólo puntualmente, a $f$ en este entorno).
En el requisito de consistencia, los polinomios dados $q$ y $r$ , si $r-q$ tiene coeficientes de Bernstein no negativos después de elevar $q$ y $r$ al grado $n$ entonces $q\preceq_{n}r$ .
El requisito de consistencia equivale en la práctica a lo siguiente (Nacu y Peres 2005; Farouki y Rajan 1988):
-
Para cada número entero $k\in[0,2n]$ y cada número entero $n>=1$ que es una potencia de 2-
- $a(2n, k)\ge\sum_{i=\max(0, k-n)}^{\min(k, n)}a(n, i){n \choose i}{n \choose k-i}/{2n \choose k}$ y $b(2n, k)\le\sum_{i=\max(0, k-n)}^{\min(k, n)}b(n, i){n \choose i}{n \choose k-i}/{2n \choose k}$ y
- $a(2n, k)\ge\mathbb{E}[a(n, X)]$ y $b(2n, k)\le\mathbb{E}[b(n, X)]$ , donde $X$ es un hipergeométrico( $2n$ , $k$ , $n$ ).
- Para cada número entero $k\in[0, n+1]$ y cada número entero $n>1$ , $a(n,k) = (k/n)*a(n-1,\max(0, k-1)) + ((n-k)/n)*a(n-1,\min(n-1,k))$ y $b(n,k) = (k/n)*b(n-1,\max(0, k-1)) + ((n-k)/n)*b(n-1,\min(n-1,k))$
Los esquemas de aproximación pueden tener la siguiente forma (entre otras):
- $a(n, k)=f(k/n)-K_{f}(n, k/n)$ y
- $b(n, k)=f(k/n)+K_{f}(n, k/n)$ ,
Donde $K{f}(n, \lambda)$ es un valor que depende de la función $f$ el grado $n$ y el punto $\lambda$ . Si $a(n, k)\lt0$ para un determinado $n$ y algunos $k$ entonces todos $a(n, k)$ por eso $n$ se toman como 0 en su lugar. Si $b(n, k)\gt1$ para un determinado $n$ y algunos $k$ entonces todos $b(n, k)$ por eso $n$ se toman como 1 en su lugar.
Notas adicionales:
-
He encontrado varios métodos para construir secuencias polinómicas requerido por el algoritmo de Thomas y el algoritmo de atuszyski, pero la mayoría de ellos tienen problemas. Por ejemplo, el método de Holtz et al. 2011 requiere conocer la clase de suavidad de la función y exige que la función esté acotada lejos de 0 y 1. Además, la fórmula para calcular los coeficientes de Bernstein se vuelve cada vez más compleja (y, por tanto, menos eficiente) a medida que el grado o la clase de suavidad es grande. Por último, el método utiliza varias constantes, a saber, "s", " $_$ ", y "D", sin límites inferiores fáciles. A pregunta relacionada busca una forma práctica de aplicar el método Holtz.
-
Muchos otros métodos, incluyendo el método de Gal (1989) y los dados en otra pregunta no se garantiza que produzcan polinomios que cumplan el requisito de consistencia.
-
Como el respuesta a continuación muestra, he encontrado resultados de este tipo para la gran mayoría de las funciones de fábrica utilizadas en la práctica (incluidas las funciones continuas de Hölder y las dos veces diferenciables), pero no para todas las funciones. Además, ninguno de ellos asegura un tiempo de ejecución con expectativa finita en general.
Sospecho que un tiempo de ejecución con expectativa finita no es posible en general a menos que las probabilidades residuales formadas por los polinomios sean de orden $O(1/n^{2+\epsilon})$ para que sea positivo $\epsilon$ que Holtz et al. (2011) demostraron que sólo es posible si la función a simular es $C^2$ continua. Sospecho que esto es así porque las sumas de las probabilidades residuales de la forma $O(1/n^2)$ no convergen, pero dichas sumas sí convergen cuando el orden es $O(1/n^{2+\epsilon})$ .
De ahí la segunda pregunta que se ha planteado.
REFERENCIAS:
- Thomas, A.C., Blanchet, J., " Una aplicación práctica de la fábrica de Bernoulli ", arXiv:1106.2508v3 [stat.AP], 2012.
- atuszyski, K., Kosmidis, I., Papaspiliopoulos, O., Roberts, G.O., "Simulating events of unknown probabilities via reverse time martingales", arXiv:0907.4018v2 [stat.CO], 2009/2011.
- Keane, M. S., y O'Brien, G. L., "A Bernoulli factory", ACM Transactions on Modeling and Computer Simulation 4(2), 1994.
- Goyal, V. y Sigman, K., 2012. Sobre la simulación de una clase de polinomios de Bernstein. ACM Transactions on Modeling and Computer Simulation (TOMACS), 22(2), pp.1-5.
- Gal, S.G., "Aproximación constructiva mediante secuencias polinómicas monótonas en Labio <em>M </em> con (0, 1]", Revista de Teoría de la Aproximación 59 (1989).
- Holtz, O., Nazarov, F., Peres, Y., "New Coins from Old, Smoothly", Constructive Approximation 33 (2011).
- Nacu, erban, y Yuval Peres. "Fast simulation of new coins from old", The Annals of Applied Probability 15, no. 1A (2005): 93-115.
- Farouki, R.T., y Rajan, V.T., "Algorithms for polynomials in Bernstein form", Computer Aided Geometric Design 5(1), 1988.