Estoy buscando una paramétrica del modelo de probabilidad cuya pdf tiene las siguientes características: (1) se apoya en un eje de la variable aleatoria que está acotada entre 0 y 1; (2) es continua; y (3) es capaz de tener dos (o más) de los modos que no son necesariamente ubicado en 0 o 1 (por ejemplo, en contraste con la distribución beta cuyo un y b son ambos <1). Estoy pensando en algún tipo de expansión en la beta o Kumaraswamy distribución análoga a la bi-Weibull de expansión en la distribución de Weibull. Mi intención es utilizar este modelo como una distribución de muestreo para la muestra proporciones que varían continuamente. Mis datos simulados tienden hacia el lado bajo de la variable de rango, típicamente varía entre 0 y 0.01, con un centro de masa que en el barrio de 0,001. Vea la ilustración de abajo para los ejemplos. Alguien ha de ejecutar a través de un oscuro distribución que cumple con este desafiante combinación de criterios?
Respuestas
¿Demasiados anuncios?Por qué no considerar una mezcla finita de distribución?
En este caso, probablemente, uno con dos componentes, aunque algunos de esos terrenos, podría ser mejor aproxima por tres componentes de las mezclas.
Cada componente sería algo apropiado para una proporción continua.
Un ejemplo típico sería el uso de dos diferentes distribuciones beta.
Así que si la proporción observada es
$$Y=wX_1+(1-w)X_2\,,$$
donde los componentes se dicen
$$X_i\sim\text{Beta}(\alpha_i,\beta_i),\quad i=1,2$$
entonces la densidad es
$$f_Y(y) = wf_{X_1}(y)+(1-w)f_{X_2}(y),\quad 0\leq y\leq 1\,.$$
He aquí un ejemplo:
Los parámetros de este ejemplo:
$\quad X_1\sim \text{Beta}(1,2500)$
$\quad X_2\sim \text{Beta}(4,3500)$
$\quad w=0.35$
La distribución de $Y$ en una de dos componentes de la mezcla de las betas tiene 5 parámetros, y es muy flexible.
Me gusta la mezcla finita enfoque, mucho. Este enfoque no se me ocurre a todos, porque yo no estoy muy familiarizado con finito de modelos de mezcla. En lugar de eso, me estaba imaginando un multi-componente de expansión en una versión beta o Kumaraswamy de distribución, de forma análoga a la multi-componente de los modelos que yo estoy familiarizado con el análisis de supervivencia en la demografía, como la bi-Weibull o Siler distribuciones. Me decidí a ver si yo lo tenía en mí para trabajar con el Kumaraswamy de distribución, debido a que tiene una analíticamente manejable CDF (a diferencia de la distribución beta):
El reto aquí, sin embargo, es el ajuste de cada componente de un y b de modo que el pdf se ve a la derecha. Sólo trasteando con ella, se me ocurrió
Basado en el código R
d.multi.kumar=function(y,a,b){
k=length(a)
p.per.k=rep(0,k)
for (i in 1:k){
p.per.k[i]=(1-y^a[i])^b[i]
}
S.multi.kumar=prod(p.per.k)
h.per.k=rep(0,k)
for (i in 1:k){
h.per.k[i]=(a[i]*b[i]*y^(a[i]-1))/(1-y^a[i])
}
h.multi.kumar=sum(h.per.k)
return(S.multi.kumar*h.multi.kumar)
}
a=c(1.01,4.2)
b=c(150,1000000000)
y=seq(0,0.2,0.000001)
pdf.multi.kumar=sapply(X=y,FUN=d.multi.kumar,a,b)
plot(y,pdf.multi.kumar,"h",xlim=c(0,0.1),xlab="y",ylab="f(y)",col="light blue")
abline(h=0)
Me gusta el efecto visual de lo finito modelo de mezcla de más. La lucha sharp y horizontalmente separados de los picos de un multi-Kumaraswamy distribución parece bastante difícil. En términos de los primeros principios, no tengo ningún gran orientación, así que no estoy seguro de que un modelo de mezcla tiene más teórico que garantiza que el otro enfoque, pero lo que funciona ...