Supongamos que mis datos $y \in \{0,0.1,\ldots,1\}$ . ¿Cuáles son las consecuencias de modelar esos datos como continuos, es decir, como si $y \in [0,1]$ utilizando la distribución beta? ¿Existe una versión de la distribución beta que pueda dar cuenta de esto?
Respuestas
¿Demasiados anuncios?Se podría modelizar la variable $10Y \sim {\rm BetaBinomial}(n = 10, a, b)$ . En concreto, si $X \sim {\rm BetaBinomial}(n, a, b)$ entonces $$\Pr[X = x] = \frac{\Gamma (b+1) \Gamma (a+n) \Gamma (n+x) \Gamma (a+b-x)}{\Gamma (a) \Gamma (n) \Gamma (x+1) \Gamma (b-x+1) \Gamma (a+b+n)}.$$ La única restricción de los parámetros $a,b$ es que sean positivos; $n$ debe ser un número entero no negativo; y $x \in \{0, 1, \ldots, n\}$ . Este PMF tiene muchas propiedades interesantes: véase http://en.wikipedia.org/wiki/Beta-binomial_distribution
Es bastante fácil crear una versión discreta de la distribución beta, y en su intervalo estándar de cero a la unidad. En su caso el soporte es $Y \in \{0,0.1,\ldots,1\}$ . Consideremos entonces la función de masa de probabilidad, con $j=\{0,1,...,10\}$
$$P(Y=j/10;\alpha;\beta) = \frac{(j/10)^{\alpha-1}[1-(j/10)]^{\beta -1}}{ \sum_{j=0}^k(j/10)^{\alpha-1}[1-(j/10)]^{\beta -1}} $$
pero con $\alpha \ge 1,\;\; \beta \ge 1$ y utilizando $0^0 \equiv 1$ .
Se caracteriza por la misma flexibilidad de forma que la versión continua (salvo la "forma de U", que requeriría parámetros menores que la unidad).