1 votos

Resolución de los parámetros de la distribución log-logística a partir de momentos

Supongamos que tenemos una variable aleatoria log-logística $X$ con función de densidad de probabilidad:

$$f(x)=\frac{(\beta/\alpha)(x/\alpha)^{\beta-1}}{(1+(x/\alpha)^{\beta})^{2}}$$

donde $\alpha>0$ , $\beta>0$ y apoyo en $x\in[0,\infty)$ .

Esta variable aleatoria tiene media y varianza definidas como sigue:

$$\mathbb{E}[X]=\frac{\alpha(\pi/\beta)}{\text{sin}(\pi/\beta)}$$ $$\text{Var}[X]=\alpha^{2}\bigg[\frac{2(\pi/\beta)}{\text{sin}(2(\pi/\beta))}-\frac{(\pi/\beta)^{2}}{\text{sin}^{2}(\pi/\beta)}\bigg]$$

o, de forma más general, con $k$ momento bruto definido para $k<\beta$ : $$\mathbb{E}[X^{k}]=\alpha^{k}\frac{k(\pi/\beta)}{\text{sin}(k\pi/\beta)}$$

Ahora, ¿hay una manera inteligente de estimar los parámetros $(\alpha,\beta)$ tal que proporcione una media y una varianza deseadas?

Por lo que sé, podemos llegar a una ecuación en función de cualquiera de los parámetros, pero resolverla requiere algún tipo de optimización. Tengo curiosidad por saber si hay algún método para evitar dicha optimización.

1voto

AdamSane Puntos 1825

Tenga en cuenta que $E(X^k)$ tiene $\alpha$ presente sólo como término multiplicativo en $\alpha^k$ .

En consecuencia $E(X^a)^b/[E(X^b)^a]$ es función de $\beta$ solo. Desde $E(X^k)$ sólo existe para $\beta>k$ es mejor utilizar los momentos más bajos.

En particular, $E(X^2)/(E(X)^2)$ o $\operatorname{Var}(X)/(E(X)^2)$ o funciones convenientes de los mismos pueden utilizarse para resolver para $\beta$ (al menos numéricamente). Una vez $\beta$ es conocido, es sencillo obtener $\alpha$ de $E(X)$ .

Veamos ahora algunas formas prácticas de obtener $\beta$ .

Tenga en cuenta que $\frac{2\sin^2(x)}{\sin(2 x)} = \frac{2\sin^2(x)}{2\sin(x)\cos(x)}= \tan(x)$ (en $0<x<\pi/2$ ).

Sea $\theta=\pi/\beta$ . Entonces $E(X)^2/E(X^2)=\theta/\tan(\theta)$ para $0<\theta<\pi/2$ es monótonamente decreciente en $\theta$ y tiene la ventaja añadida de que la función está acotada en este intervalo. Esto debería ser razonablemente sencillo de resolver para $\theta$ utilizando métodos numéricos estándar de búsqueda de raíces. Dado que $E(X)^2/E(X^2)$ estará siempre entre $0$ y $1$ esto debería dar siempre una solución posible (una con $\beta>2$ )

plot of function x/tan(x) on 0 to \pi/2; flat (at 1) at x=0 then more rapidly decreasing as it gets toward x=\pi/2 - seems close to quadratic

Sin embargo, podemos acercarnos mucho a la solución -y tener límites sobre ella- con un poco más de manipulación.

Tenga en cuenta que $\sqrt{1-\frac{x}{\tan(x)}}$ es muy próxima a la lineal:

plot of function \sqrt{1-\frac{x}{\tan(x)}} or 0<x<pi/2

En ese intervalo está delimitado entre las líneas $x/\sqrt{3}$ y $\frac{2x}{\pi}$ -- cuyas pendientes sólo difieren en un 10%.

Así que los pasos serían:

  • Compute $k=\sqrt{\frac{\sigma^2}{\sigma^2+\mu^2}}$ .

  • Resolver la ecuación $\sqrt{1-\frac{\theta}{\tan(\theta)}}-k=0$ para $\theta$ mediante un cómodo algoritmo de búsqueda de raíces, con límites iniciales $\frac{\pi}{2}k<\theta<\sqrt{3}k$ . Esto debería ser muy rápido.

  • Obtenga $\beta=\pi/\theta$

  • Calcule $\alpha=\mu\frac{\sin\theta}{\theta}$ .

Ejemplo: Supongamos que queremos averiguar los parámetros de una distribución log-logística que tuviera $\mu=10$ y $\sigma=10$ .

Entonces $k=\sqrt{\frac{10^2}{10^2+10^2}}=\sqrt{2}$ . Usando R:

f=function(x,k) {sqrt(1-x/tan(x))-k}
mu=10
sigma=10
k=sqrt(sigma^2/(sigma^2+mu^2))
f0 = uniroot(f,lower=k*pi/2,upper=min(pi/2,k*sqrt(3)),k=k)
f0
$root
[1] 1.165561

$f.root
[1] -3.517283e-08

$iter
[1] 3

$init.it
[1] NA

$estim.prec
[1] 6.103516e-05

Así que $\theta\approx 1.165561$ .

 theta=f0$root
 beta=pi/theta
 alpha=10*sin(theta)/theta
 alpha;beta
[1] 7.884698
[1] 2.695348

Ahora comprobemos que realmente hemos obtenido la media y la sd que pretendíamos:

 alpha*pi/beta/sin(pi/beta)
[1] 10
 alpha*sqrt(2*pi/beta/sin(2*pi/beta)-(pi/beta)^2/sin(pi/beta)^2)
[1] 9.999999

Unos 7 dígitos de precisión esa vez (probablemente tuvimos un poco de suerte consiguiendo que la raíz se acercara tanto a 0 esa vez; la precisión estimada sugiere que no debería haber funcionado tan bien).

Tiene buena pinta; parece que hace lo que debe.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X