11 votos

Aproximación rápida a la CDF beta inversa

Busco una aproximación rápida a la FCD inversa de la distribución Beta. La aproximación no tiene por qué ser precisa, sino que se hace hincapié en la simplicidad (estoy pensando en la expansión de Taylor de los primeros 1 o 2 términos). ¿Alguna idea?

Algunos detalles más: en mi distribución Beta, $a,b$ son enteros. Además, el valor del que evalúo la inversa es siempre 0,05.

10voto

Patrick Puntos 183

El comentario de whuber es especialmente cierto si se quieren calcular desigualdades beta (por ejemplo, la probabilidad de que una v.r. con distribución beta supere a otra v.r. con distribución beta). Véase aquí para más detalles.

Otra alternativa, señalada por J. Cook en su blog es utilizar el Kumaraswamy para aproximarse a la distribución Beta. Para cumplir con la regla de validación cruzada, voy a resumir brevemente los elementos principales aquí, pero ir a leer ese post. La FCD de una $K(a, b)$ variable es:

$$F(x|a,b)=1–(1–x^a)^b$$

Este CDF es fácil de invertir y de extraer, por lo que se puede generar fácilmente una extracción de $K(a,b)$ generando un $u$ uniforme en $[0,1]$ y:

$$F^{-1}(u)=(1 – (1 – u)^{1/b})^{1/a}$$

La idea es que puedas recoger los parámetros $a$ y $b$ para que coincida con la mayoría de $\text{beta}(\alpha,\beta)$ razonablemente bien: elige $a=\alpha$ y utilizar un enfoque numérico para encontrar el óptimo $b|a$ . Una vez más, se dan más detalles en el post original. Como alternativa, puede utilizar una tabla precalculada de conjuntos de parámetros equivalentes para las distribuciones Beta y Kumaraswamy (véase aquí ) o calcular uno tú mismo.

8voto

jldugger Puntos 7490

Para aplicaciones como ésta, hay que leer la literatura con atención, porque la aproximación de otra persona podría no reproducir la característica usted están interesados.

Existen soluciones sencillas basadas en el precalculo de valores dentro del rango donde una simple aproximación (como una aproximación Normal) podría no hacer un buen trabajo. En este caso, lo que más le preocuparía es que la asimetría fuera alta: eso sería cuando los parámetros Beta son muy desiguales y relativamente pequeños.

Una solución es crear una función de interpolación o una tabla de búsqueda basada en este cálculo previo. Para encontrar la FCD inversa en $0.95$ , primero busca su valor. Si el valor se encuentra en la tabla, utilícelo; si no, utilice la aproximación genérica. Dada la facilidad con la que se pueden precalcular y almacenar millones de valores, este es el camino a seguir para las simulaciones intensivas en un PC>

Si la memoria RAM es realmente escasa o, por alguna razón, usted realmente quiere una fórmula, entonces la tabla de búsqueda debe ser reemplazada por una fórmula. Una buena herramienta para ajustar fórmulas para este propósito es Eureqa Formulize una descarga gratuita. Este software identifica y ajusta funciones a datos tabulados (mediante un algoritmo genético). Es extremadamente rápido, fácil de aprender y divertido de ver en acción.

Utilizando una tabla del $0.95$ cuantil de las distribuciones Beta para valores enteros $(a,b)$ en el rango $1\ldots 10$ y minimizar El peor de los casos error, he encontrado -ejecutando el software mientras escribía este párrafo- un gran número de aproximaciones. El caso base es la propia aproximación normal, $z = \text{mean} + \Phi^{-1}(0.95)\times\text{SD}$ . Su error en el peor de los casos es de alrededor de $0.085$ (que no es terriblemente bueno). Las fórmulas que he buscado son en términos de $a$ , $b$ , $z$ la asimetría (cuya fórmula en términos de $a$ y $b$ puede buscar en Wikipedia ), y el tercer momento central $s_3$ (se obtiene multiplicando la asimetría por el cubo de la DE). Entre las fórmulas más sencillas están

$$0.0012526 + z + 8.90369 s_3 + 0.0344753 z\times \text{skewness}$$

con un error en el peor de los casos de $0.011$ -bueno. Esto es reconocible como la aproximación Normal $z$ más las correcciones para (a) utilizar el error del peor caso como criterio, que tiende a introducir un pequeño sesgo ( $0.0013$ ) y (b) la asimetría (como se esperaba). Esta fórmula se utilizaría siempre que ambos $a$ y $b$ son $10$ o menos; de lo contrario, se volvería a la aproximación Normal ( $z$ mismo).

Aquí hay un gráfico que compara mis valores tabulados (puntos) con la fórmula, tomada directamente del software:

enter image description here

(Los valores saltan porque esta tabla, por supuesto, es bidimensional: se organizó originalmente por $a$ y $b$ pero luego se ha aplanado en un formato de hoja de cálculo tradicional para este análisis).

Aplicando este enfoque a un conjunto de valores tabulados usted que más le interesa, obtendrá diferentes fórmulas. Elige la que mejor equilibre la precisión deseada con la complejidad de la fórmula.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X