Dada una proporción y su error estándar, ¿qué hipótesis de distribución minimiza los supuestos/maximiza la entropía? ¿Es la beta (y puedo utilizar el método de los momentos para estimar sus parámetros)? ¿O alguna otra cosa?
Respuesta
¿Demasiados anuncios?Es una distribución normal truncada . Esto es una consecuencia de Teorema de Boltzmann .
El siguiente análisis proporciona los detalles necesarios para aplicar una solución práctica.
A Normal $(\mu,\sigma)$ distribución $F$ truncado en el intervalo $[0,1]$ surge al tomar una variable Normal estándar $X$ con una distribución de probabilidad $\Phi$ , escalándolo en $\sigma$ , desplazándolo a $\mu$ y truncando a $[0,1]$ . De forma equivalente -trabajando hacia atrás- la variable original $X$ debe haberse truncado en el intervalo $[-\mu/\sigma, (1-\mu)/\sigma]$ donde tenía una probabilidad total de
$$C = \Phi\left(\frac{1-\mu}{\sigma}\right) - \Phi\left(\frac{-\mu}{\sigma}\right),\tag{1}$$
expectativa
$$\mu_1=\frac{1}{C\sqrt{2\pi}}\int_\frac{-\mu}{\sigma}^\frac{1-\mu}{\sigma} x\exp\left(\frac{-x^2}{2}\right)\mathrm{d}x,$$
y el segundo momento (crudo)
$$\mu_2 = \frac{1}{C\sqrt{2\pi}}\int_\frac{-\mu}{\sigma}^\frac{1-\mu}{\sigma} x^2\exp\left(\frac{-x^2}{2}\right)\mathrm{d}x.$$
Presumiblemente su "error estándar" es $\sqrt{\mu_2-\mu_1^2}$ o algún múltiplo constante del mismo.
Estas integrales se pueden calcular en términos de
$$\mu_1(z) = \frac{1}{C\sqrt{2\pi}}\int_{-\infty}^z x\exp\left(\frac{-x^2}{2}\right)\mathrm{d}x = -\frac{1}{C\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right)\tag{2}$$
y, la integración por partes,
$$\eqalign{ \mu_2(z) &= \frac{1}{C\sqrt{2\pi}}\int_{-\infty}^z (x)\left(x\exp\left(\frac{-x^2}{2}\right)\right)\mathrm{d}x \\ &= \frac{1}{C\sqrt{2\pi}}\left(x\left(-\exp\left(-\frac{x^2}{2}\right)\right)\mid_{-\infty}^z - \int_{-\infty}^z -\exp\left(-\frac{x^2}{2}\right)\mathrm{d}x \right)\\ &=-\frac{1}{C\sqrt{2\pi}}z\exp\left(-\frac{z^2}{2}\right) + \frac{1}{C}\Phi(z)\tag{3}. }$$
Así,
$$\mu_1 = \mu_1\left(\frac{1-\mu}{\sigma}\right) - \mu_1\left(\frac{-\mu}{\sigma}\right)$$
y
$$\mu_2 = \mu_2\left(\frac{1-\mu}{\sigma}\right) - \mu_2\left(\frac{-\mu}{\sigma}\right).$$
Estos cálculos $(1)$ , $(2)$ y $(3)$ puede implementarse en cualquier software en el que los exponenciales, raíces cuadradas y $\Phi$ están disponibles. Esto permite su aplicación en cualquier procedimiento de ajuste, como el método de los momentos o la máxima verosimilitud. Cualquiera de ellos requeriría soluciones numéricas.