6 votos

Distribución de las diferencias en la distribución beta

Quiero obtener una solución analítica a la diferencia entre el mayor y el segundo mayor de una distribución beta.

Más sencillamente, tengo unos puntos de datos sobre los que asumo una distribución beta. Analíticamente puedo obtener una distribución acumulativa $F_n(x)$ sobre el máximo de una muestra de tamaño $n$ de la distribución acumulativa original $F(x)$ :

$F_n(x) = P(X_n < x) = F(x)^n$

Pero ahora quiero obtener una distribución sobre la diferencia entre el más alto y el segundo más alto de una muestra. ¿Hay alguna forma de hacerlo?

Si utilizo una solución de muestreo obtengo distribuciones como ésta (sin normalizar): Histogram of differences between highest and second highest sample of betadistribution

5voto

Lev Puntos 2212

Si nos fijamos en la densidad conjunta de $(X_{(n-1)},X_{(n)})$ las dos mayores observaciones, su densidad conjunta viene dada por $$g_n(x,y)=\dfrac{n!}{(n-2)!0!0!}F(x)^{n-2}[F(y)-F(x)]^0[1-F(y)]^0f(x)f(y)\mathbb{I}_{x\le y}$$ (donde el $0$ están considerando el caso especial $j=n-1$ , $k=n$ en la fórmula genérica ).

De ahí la derivación de la distribución de la diferencia $Z_{n}=(X_{(n)}-X_{(n-1)})$ es una mera fórmula de convolución, es decir, un caso especial de cambio de variables: $$\begin{align}Z_n\sim&\int_\mathcal{X} g_n(x,x+z)\, \text{d}x\ \mathbb{I}_{(0,\infty)}(z)\\ &=n(n-1)\,\int_\mathcal{X} F(x)^{n-2}f(x)f(x+z)\, \text{d}x\ \mathbb{I}_{(0,\infty)}(z) \end{align}$$ En el caso especial de una Beta $\mathfrak{B}(a,b)$ distribución, $F=F(\cdot;a,b)$ no tiene expresión analítica en general, por lo que se obtiene $$n(n-1)B(a,b)^{-2}\,\int_0^{1-z} F(x;a,b)^{n-2}x^{a-1}(1-x)^{b-1}(x+z)^{a-1}(1-x-z)^{b-1}\, \text{d}x\ \mathbb{I}_{(0,1}(z)$$

0 votos

No he seguido tu comentario de que, en el caso de una distribución Beta, la fdc $F$ no tiene expresión analítica. La fdc de una variable aleatoria Beta es $$\frac{B_x(a,b)}{B(a,b)}$$ donde el numerador es la función Beta incompleta.

0 votos

También podría valer la pena revisar lo anterior en busca de errores tipográficos, con un ejemplo sencillo. Por ejemplo, con a = 1, b = 3 y n=2, lo anterior no parece integrar a la unidad.

1 votos

@wolfies: (a) todo depende de cómo se defina $B(a,b)$ b) si se sustituye $F(x;a,b)$ con $B_x(a,b)$ hace que la integral se pueda calcular analíticamente para valores no enteros de $(a,b)$ Gracias por informarnos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X