Bien encontrado +1. Se trata de un problema bastante áspero debido a las declaraciones confusas en las obras de referencia.
El artículo de Casella
A mí me parece que el artículo de Casella contiene un error al utilizar el $\alpha = 0.25$ y $\beta = 0.43$ .
Ya debería estar claro, a partir de una comprobación de cordura, que $\frac{0.25}{0.25+0.43}$ no da lugar en modo alguno al valor 0,172 de la media $\bar{l_s}$
(además, si rellena estos valores para $\alpha$ y $\beta$ en la ecuación (4.4), entonces no se llega al resultado de la ecuación (4.6)) .
No me queda claro qué hicieron ahí, para obtener estos resultados, pero un error en el álgebra parece fácil.
Expresión para $\alpha$ y $\beta$
Si tomamos su ecuación (4.5)
$$E(I_i^S) = \frac{\alpha}{\alpha+\beta} \\ var(I_i^S) = \frac{1}{10} \left( \frac{\alpha}{\alpha+\beta} \right) \left(1 - \frac{\alpha}{\alpha+\beta} \right) \left( \frac{\alpha + \beta + 10}{\alpha + \beta + 1}\right)$$
(Donde observamos que estos son los momentos para $I_i^S \sim \frac{1}{10} binomial(10,I_i^T)$ y no como se indica en su ecuación (4.2) $I_i^S \sim binomial(10,I_i^T)$ . Se trata de un matiz detallado, aunque importante, que tratan con un "esto puede, por supuesto, manejarse fácilmente, y no entraremos aquí en tanto detalle").
podemos escribir, utilizando simplificaciones $\mu = E(I_i^S)$ y $vr = var(I_i^S)$ lo siguiente:
$$\alpha = \frac{(\mu(1-\mu)-vr)\mu}{vr-\frac{1}{10}\mu(1-\mu)} \\ \beta = \alpha \frac{1-\mu}{\mu} $$
(existen muchas otras formas, la cuestión es que la expresión expresa ahora $\alpha$ y $\beta$ como funciones de $\mu$ y $vr$ )
Y obtenemos con media 0,172 y varianza 0,091 lo siguiente:
$$\alpha = 0.11 \quad, \qquad \beta=0.55$$
introduciéndolas en la ecuación (4.4) se obtiene una expresión muy parecida a la ecuación (4.6)
$$\hat{I}_i^S = (.401)(.172) + (.599) I_i^S $$
(El contraste con la ecuación (4.6) son los términos $.401$ y $.599$ en lugar de $.405$ y $.595$ . Obtendríamos estos términos exactamente para $\alpha=.25$ y $\beta=.43$ pero entonces el $.172$ término es completamente erróneo )
Así que este resultado vuelve a ser el mismo, y puede parecer que Casella, no vio razón para volver a comprobar las ecuaciones porque el resultado seguía siendo bueno (aún faltando el llamativo error en la expresión $\mu \neq \frac{0.25}{0.25+0.43}$ ).
El uso de ebbr
Hay algunos problemas en tus expresiones. En realidad no entiendo muy bien lo que intentas hacer. La siguiente es una expresión que funciona (utilizando el método de los momentos, que también se hace arriba y en el artículo de Casella):
> # number of successes (multiplying the intent data by 10)
> x <- c(rep(0,293),
rep(1,26),
rep(2,21),
rep(3,21),
rep(4,10),
rep(5,9),
rep(6,12),
rep(7,13),
rep(8,11),
rep(9,10),
rep(10,21))
> # total number of trials (n = 10 for every person according to the Morrison 1979 model)
> n <- rep(10,447)
> # table
> tab <-tibble(x=x,n=n)
> # beta-model (note this not really doing a beta-binomial distribution)
> tab %>% ebbr::ebb_fit_prior(x=intent,n=n,method = "mm")
Empirical Bayes binomial fit with method mm
Parameters:
# A tibble: 1 x 2
alpha beta
<dbl> <dbl>
1 0.09694816 0.4680561
Obsérvese que existe una discrepancia. Esto se debe a que la función ebbr no está haciendo realmente una distribución beta-binomial. Lo que está haciendo es calcular las probabilidades en cada experimento binomial individual $p=x/n$ y haciendo cálculos sobre esos valores $p$ utilizando $\mu(p)$ y $var(p)$ en lugar de $\mu(x)$ y $var(x)$ . Esto resulta en:
$$\alpha = \frac{(\mu(1-\mu)-vr)\mu}{vr} \\ \beta = \alpha \frac{1-\mu}{\mu} $$
La diferencia con las expresiones anteriores es que no se tiene en cuenta la varianza de los datos, debida a la distribución binomial (no es una práctica muy correcta). La varianza de la distribución beta-binomial tiene un término adicional $n(\alpha + \beta + n)$ que sólo se tiene en cuenta en el paquete "ebbr" aproximando con $n^2$ (utilizando una simple división por n para todos los valores de x).
Otra nota
El artículo de Casella parece muy breve al explicar cómo obtienen la ecuación (4.4), que se parece a la ecuación (2.7), pero la relación no se explica y queda bastante vaga.