Supongamos que se modela la probabilidad mediante el estadístico suficiente $\bar{X}$ : \begin{equation} P(D|\mu) \propto \textrm{Exp}(-\frac{n}{2\sigma²}(\overline{x}-\mu)^2) \propto N(\overline{x},\theta,\frac{1}{n}) \end{equation} Y utilizar lo siguiente como un previo para $\mu$ : \begin{equation} P(\mu) \propto \textrm{Exp}(-\frac{n}{2\sigma_0^2}(\mu-\mu_0)^2) \propto N(\mu|\mu_0,\sigma_0^2) \end{equation}
Tenemos que demostrar que el producto de estas dos distribuciones tiene un núcleo que es el núcleo (en función de $\mu$ ) de una distribución normal; así que podemos ignorar todas las constantes de normalización y cualquier término que no contenga $\mu$ .
\begin{equation} \begin{split} P(D|\mu)P(\mu) & \propto \textrm{Exp}(-\frac{n}{2\sigma²}(\overline{x}-\mu)^2) \textrm{Exp}(-\frac{n}{2\sigma_0^2}(\mu-\mu_0)^2) \\ & = \textrm{Exp}(-\frac{n}{2}[\frac{1}{\sigma^2}(\bar{X}^2 - 2\bar{X}\mu + \mu^2)+\frac{1}{\sigma_0^2}(\mu^2 - 2\mu\mu_0 + \mu_0^2)]) \end{split} \end{equation}
Desechar los términos que no contengan $\mu$ , obtenemos: \begin{equation} \begin{split} \textrm{Exp}(-\frac{n}{2}[\frac{1}{\sigma^2}(2\bar{X}\mu + \mu^2)+\frac{1}{\sigma_0^2}(\mu^2 - 2\mu\mu_0)]) & \propto \textrm{Exp}(-\frac{n}{2}[\mu^2(\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2}) +\mu(\frac{2\bar{X}}{\sigma^2}-\frac{2\mu_0}{\sigma_0^2})]) \end{split} \end{equation}
Ahora para obtener una cuadrática en $\mu$ (y por tanto una distribución normal adecuadamente especificada) completamos el cuadrado:
\begin{equation} \begin{split} \textrm{Exp}(-\frac{n}{2}[\mu^2(\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2}) +\mu(\frac{2\bar{X}}{\sigma^2}-\frac{2\mu_0}{\sigma_0^2})]) & = \textrm{Exp}(-\frac{n}{2}[a(\mu-h)^2 + k]) \end{split} \end{equation}
Para algunos $a$ , $h$ y un término $k$ que no implique $\mu$ y se puede retirar.
En concreto, ignorar $k$ tenemos que $a = (\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2})$ y que $h = -\frac{(\frac{2\bar{X}}{\sigma^2}-\frac{2\mu_0}{\sigma_0^2})}{2(\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2})}$ .
Esto nos da nuestra media ( $h$ ), y el recíproco de nuestra varianza (hasta el reescalado por el $n$ factor presente):
\begin{equation} \begin{split} \textrm{Exp}(-\frac{n}{2}[\mu^2(\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2}) +\mu(\frac{2\bar{X}}{\sigma^2}-\frac{2\mu_0}{\sigma_0^2})]) & \propto \textrm{Exp}(-\frac{n(\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2})}{2}[(\mu-\frac{(\frac{2\bar{X}}{\sigma^2}-\frac{2\mu_0}{\sigma_0^2})}{2(\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2})})^2]) \end{split} \end{equation}
Que es un $\textrm{N}(\frac{(\frac{2\bar{X}}{\sigma^2}-\frac{2\mu_0}{\sigma_0^2})}{2(\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2})}, (\frac{1}{n}(\frac{1}{\sigma^2} + \frac{1}{\sigma_0^2})^{-1})$ .
Que corresponde al resultado dado aquí hasta cierta anulación de valores. La prior conjugada especificada en el problema también tiene la $n$ que la página de Wikipedia no tiene. Usted puede simplemente colapsar que en $\sigma_0$ para obtener el mismo resultado que ellos.