Supongamos que tomamos una muestra ( $X_1, X_2, ... X_n$ ) de una distribución en la que suponemos que $X_i $ ~ $ Bin(n_i, p_i)$ y $n_i$ es conocido por cada $i$ . También suponemos que $p_i$ son independientes e idénticamente distribuidos, $p_i$ ~ $D$ , donde $D$ es una distribución desconocida. $n_i$ no puede suponerse que sea grande.
Mi objetivo es obtener una estimación bayesiana (o una distribución de probabilidad) para $p_i$ . Pero para ello es necesario idear una distribución para $D$ .
Una opción es hacer una distribución empírica que utilice estimaciones frecuentistas para cada $p_i$ (es decir $p_i = X_i/n_i$ ). Esta es una idea bastante intuitiva y potencialmente razonable. Por desgracia, la presencia de pequeños $n_i$ haría que las colas fueran más pesadas de lo que deberían (muchos valores extremos cercanos a 0 o 1).
Estoy buscando otra opción que no tenga los problemas de la solución mencionada.
Una posibilidad que tengo en mente es utilizar el siguiente algoritmo:
- Generar la distribución previa como se ha explicado anteriormente.
- Obtenga una estimación de MAP o EAP para cada $p_i$ .
- Generar una nueva prioridad empírica a partir de las probabilidades obtenidas en 2.
- Vuelve a 2 (continúa durante un número determinado de pasos, o posiblemente hasta la convergencia )
¿Es este método similar a cualquier otro que exista? ¿Es razonable?