15 votos

¿Cómo puedo (numéricamente) valores aproximados para una distribución beta con grandes alfa y beta

Hay una numéricamente de forma estable, para calcular los valores de una distribución beta para grandes entero alfa, beta (por ejemplo, alfa,beta > 1000000)?

En realidad, sólo necesito un 99% intervalo de confianza alrededor de la modalidad, si es que de alguna manera hace que el problema sea más fácil.

Agregar: lo siento, mi pregunta no era tan claramente como yo creía. Lo que quiero hacer es esto: tengo una máquina que inspecciona los productos en una cinta transportadora. Algunos fracción de estos productos es rechazada por la máquina. Ahora bien, si el operador de la máquina cambia algunos de inspección, ajuste, quiero mostrar que él/ella en la estimación de rechazar la tasa y alguna sugerencia acerca de cómo fiable la estimación actual es.

Así que pensé en el tratamiento de la real rechazar la tasa como una variable aleatoria X, y calcular la distribución de la probabilidad de que la variable aleatoria basada en el número de rechazados objetos de N y aceptado objetos de M. Si asumo un uniforme antes de la distribución de X, esto es una beta de la distribución en función de N y M. me puede mostrar esta distribución a los usuarios directamente o a encontrar un intervalo [l,r] para que el real rechazar la tasa es en este intervalo de con p >= 0.99 (utilizando shabbychef la terminología) y la pantalla de este intervalo. Para las pequeñas M, N (es decir, inmediatamente después del cambio de parámetro), puedo calcular la distribución directa y aproximada el intervalo [l,r]. Pero para la gran M,N, este enfoque ingenuo conduce a subdesbordamiento de errores, debido a que x^N*(1-x)^M es pequeño para ser representado como un flotante de doble precisión.

Creo que mi mejor opción es usar mi ingenuo beta-distribución para las pequeñas M,N y cambiar a una distribución normal con la misma media y varianza tan pronto como M,N exceder de un cierto umbral. ¿Que sentido?

13voto

jldugger Puntos 7490

Una aproximación Normal funciona muy bien, especialmente en las colas. El uso de una media de $\alpha/(\alpha+\beta)$ y una variación de $\frac{\alpha\beta}{(\alpha+\beta)^{2} (1+\alpha+\beta)}$. Por ejemplo, el absoluto error relativo en la cola de la probabilidad en una situación difícil (donde la asimetría podría ser motivo de preocupación) como $\alpha = 10^6, \beta = 10^8$ picos de alrededor de $0.00026$ y está a menos de $0.00006$ cuando estás más de 1 desviaciones estándar de la media. (Esto es , no porque la beta es tan grande: con $\alpha = \beta = 10^6$, la absoluta relativa errores están delimitadas por $0.0000001$.) Por lo tanto, esta aproximación es excelente para prácticamente cualquier propósito que involucra el 99% de los intervalos.

A la luz de las modificaciones a la pregunta, tenga en cuenta que no se compute beta integrales por el hecho de integrar el integrando: por supuesto que lo voy a conseguir underflows (a pesar de que realmente no importa, porque no contribuyen apreciablemente a la integral). Hay muchas, muchas maneras de calcular la integral o aproximada, como se documenta en Johnson Y Kotz (Distribuciones en las Estadísticas). Una calculadora en línea se encuentra en http://www.danielsoper.com/statcalc/calc37.aspx. Usted realmente necesita el inverso de esta integral. Algunos métodos para calcular la inversa están documentados en el sitio en Mathematica http://functions.wolfram.com/GammaBetaErf/InverseBetaRegularized/. Se proporciona el código Numérico de Recetas (www.nr.com). Realmente una buena calculadora en línea es el Wolfram Alpha sitio (www.wolframalpha.com ): escriba inverse beta regularized (.005, 1000000, 1000001) para el extremo izquierdo y el inverse beta regularized (.995, 1000000, 1000001) para el extremo derecho ($\alpha=1000000, \beta=1000001$, 99% de intervalo).

3voto

Berek Bryan Puntos 349

Una rápida gráfica experimento sugiere que la distribución beta se asemeja mucho a una distribución normal cuando el alfa y beta son muy grandes. Buscando en google "distribución beta límite normal" que he encontrado http://nrich.maths.org/discus/messages/117730/143065.html?1200700623, lo que da un handwaving 'prueba'.

La página de wikipedia para la distribución beta da su media, el modo (v cerca de la media para la gran alfa y beta) y de la varianza, por lo que puede utilizar una distribución normal con la misma media y varianza para obtener una aproximación. Si es una buena aproximación para sus propósitos depende de lo que sus efectos son.

2voto

Akira Puntos 1061

Voy a inferir desea un intervalo de $[l,r]$ de manera tal que la probabilidad de que un sorteo al azar de la Beta de RV está en el intervalo con una probabilidad de 0.99, con puntos de bonificación por $l$ $r$ ser simétrica alrededor de la modalidad. Por Gauss' la Desigualdad o la desigualdad vysochanskii-Petunin, se pueden construir intervalos que contienen el intervalo de $[l,r]$, y sería bastante decente aproximaciones. Por lo suficientemente grande $\alpha, \beta$, tendrá numérica de subdesbordamiento de problemas, incluso representando $l$ $r$ como distintos números, por lo que esta ruta puede ser lo suficientemente bueno.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X