Dada una función de pérdida cuadrática, el estimador de Bayes viene dado por \begin{equation}\hat{\theta} = E[\theta|y] = \frac{\int_\Theta\theta p(y|\theta) p(\theta) d\theta}{\int_\Theta p(y|\theta) p(\theta) d\theta}\end{equation} donde $\theta\in\Theta$ es el vector de parámetros, $y$ son los datos, $p(\theta)$ es la prioridad, $p(\theta|y)$ es la posterior, y $p(y|\theta)$ es la probabilidad. Se han desarrollado diversas técnicas numéricas (muestreo de rechazo, métodos MCMC, etc.) para extraer información de la distribución posterior cuando no se dispone de un muestreo directo de la misma. Estas técnicas permiten estimar $E[\theta|y]$ con \begin{equation}E[\theta|y]\approx\frac{1}{n}\sum_{i=1}^n\theta_i\end{equation} donde $\theta_i$ es el $i^{th}$ sacar de la parte posterior.
Mi pregunta: Si somos capaces de extraer de la distribución a priori, ¿no podríamos simplemente muestrear la previa para aproximar numéricamente las integrales del lado derecho de la primera ecuación? En otras palabras, aproximar $E[\theta|y]$ con \begin{equation}E[\theta|y]\approx \frac{\frac{1}{n}\sum_{i=1}^n\theta_i p(y|\theta_i)}{\frac{1}{n}\sum_{i=1}^np(y|\theta_i)} = \frac{\sum_{i=1}^n\theta_i p(y|\theta_i)}{\sum_{i=1}^np(y|\theta_i)} \end{equation} donde $\theta_i$ es el $i^{th}$ de la anterior. Esto parece ser una alternativa más conveniente y computacionalmente eficiente que las técnicas de muestreo de rechazo y MCMC. Entiendo que en algunos casos no podemos extraer de la prioridad, pero en esos casos ¿por qué no elegir diferentes prioridades? No he visto el método que propongo discutido en ningún libro de texto o en línea, así que espero que alguien pueda explicarme la locura de este enfoque.