En Selección de la variable de espiga y de la losa (ecuación 4) existe una configuración del modelo de la forma
$\beta_k | \lambda_k, \tau_k \sim \text{Normal} (0, \lambda_k \tau_k^2)$
$\lambda_k | \nu_0, w \sim (1-w)\delta_{\nu_0}(\lambda_k) + w \delta_1(\lambda_k)$
donde $\beta_k$ es el $k^{th}$ coeficiente de regresión y $\delta_x$ es la función dirac-delta centrada en $x$ (He cambiado ligeramente la notación).
Estoy tratando de derivar un muestreador de Gibbs para un modelo similar. El muestreador de Gibbs para este algoritmo está en el apéndice del enlace anterior (página 43). Mi confusión viene de la actualización para $\lambda_k$ :
$p(\lambda_k | \cdot) \propto p(\beta_k | 0, \lambda_k \tau_k^2) p(\lambda_k | \nu_0, w)$
lo que, si se sigue, da una densidad no normalizada de la forma
$\frac{1}{\sqrt{\lambda_k \tau_k^2}} \exp(-\frac{2}{\lambda_k \tau_k^2}\beta_k^2)[(1 - w) \delta_{\nu_0}(\lambda_k) + w \delta_1(\lambda_k)]$
Intuitivamente, puedo ver cómo multiplicando el factor del exponente con el primer término se obtiene una masa puntual en $\nu_0$ y con la segunda se obtiene una masa puntual en $1$ que luego normalizamos para obtener la actualización de Gibbs en el documento adjunto (es decir, todas las $\lambda_k$ s en la ecuación anterior se establecen en $\nu_0$ o $1$ para la actualización). Sin embargo, creo que algunas cosas no tienen sentido del todo:
- Las funciones delta de Dirac "eligen" los valores de la masa del punto cuando se integran en la región alrededor de la masa del punto, pero aquí no hay tal integración.
- De todos modos, ¿cómo se toma una muestra de una distribución condicional de este tipo? ¿Es simplemente la media ponderada de las dos masas puntuales, o una u otra masa puntual con probabilidades dadas por las ponderaciones?
- Si se trata de la media ponderada, ¿no es esto similar al ARD en lugar de a los picos y tablas, ya que volvemos a una medida continua de la dispersión?