4 votos

prueba para la predicción posterior de la conjugación normal-gamma

Dando las siguientes ecuaciones $$ \mu_n = \frac{\kappa_0 \mu_0 + n \overline{x}}{\kappa_0 + n}, \\ \kappa_n = \kappa_0 + n, \\ \alpha_n = \alpha_0 + n/2, \\ \beta_n = \beta_0 + \frac{1}{2} \sum\limits_{i=1}^n (x_i - \overline{x})^2 + \frac{\kappa_0 n (\overline{x} - \mu_0)^2}{2(\kappa_0 + n)}, $$ donde $\overline{x} = \frac{\sum_{i=1}^n x_i }{n}$ es decir, la media de los datos. En realidad, las ecuaciones anteriores son los parámetros de la conjugación normal-gamma posterior (véase la ecuación (85-89) en este documento para más detalles).

Aquí, quiero probar: $$ \mu_{n+m} = \frac{\kappa_n \mu_n + m \overline{x}}{\kappa_n + m}, \\ \kappa_{n+m} = \kappa_n + m, \\ \alpha_{n+m} = \alpha_n + m/2, \\ \beta_{n+m} = \beta_n + \frac{1}{2} \sum\limits_{i=n+1}^{n+m} (x_i - \overline{x})^2 + \frac{\kappa_n m (\overline{x} - \mu_n)^2}{2(\kappa_n + m)}, $$ donde $\overline{x} = \frac{\sum_{i=n+1}^{n+m} \quad x_i}{m}$ es decir, la media de las nuevas observaciones. Las ecuaciones anteriores aparecen en la ecuación (101-104) de este documento en el que el $m$ se fija en 1.

\=============================================================

El siguiente esfuerzo lo he intentado $$ \kappa_{n+m} = \kappa_0 + n + m = \kappa_{n} + m \\ \alpha_{n+m} = \alpha_0 + \frac{n+m}{2} = \alpha_n + \frac{m}{2} \\ \mu_{n+m} = \frac{\kappa_0 \mu_0 + \sum_{i=1}^{n+m} x_i }{\kappa_0 + n+ m} = \frac{\kappa_0 \mu_0 + \sum_{i=1}^n x_i + \sum_{i=n+1}^{n+m} x_i }{\kappa_n + m} = \frac{(\kappa_0 + n)\frac{\kappa_0 \mu_0 + \sum_{i=1}^n x_i }{\kappa_0 + n} + \sum_{i=n+1}^{n+m} x_i }{\kappa_n + m} = \frac{\kappa_n \mu_n + m\overline{x}}{\kappa_n + m} $$ donde $\overline{x} = \frac{\sum_{i=n+1}^{n+m} \quad x_i}{m}$ . Pero no consigo demostrar la última ecuación: $$ \beta_{n+m} = \beta_n + \frac{1}{2} \sum\limits_{i=n+1}^{n+m} (x_i - \overline{x})^2 + \frac{\kappa_n m (\overline{x} - \mu_n)^2}{2(\kappa_n + m)}. $$ Entonces, ¿alguien podría darme alguna sugerencia?

3voto

Lev Puntos 2212

Una forma directa y elegante de mostrar estas identidades es explotar que la distribución posterior $\pi_{n+m}(\theta|\mathfrak D_{n+m})$ asociado con el anterior $\pi_0$ y el $n+m$ observaciones $(x_1,\ldots,x_{n+m})$ es igual a la distribución posterior asociada a la "prior" $\pi_n(\theta|\mathfrak D_{n})$ y el $m$ observaciones $(x_{n+1},\ldots,x_{n+m})$ . Cuando la prioridad es conjugada, por ejemplo, Normal-Gamma, la posterior intermedia $\pi_n(\theta|\mathfrak D_{n})$ también es conjugada y la actualización de los hiperparámetros es inmediata.

Un enfoque más pedestre y desangelado es ampliar la expresión de $\beta_{n+m}$ . Para la última ecuación de actualización, introduzcamos las notaciones $\overline{x}_{1:n+m}$ , $\overline{x}_{1:n}$ y $\overline{x}_{(n+1):(n+m)}$ para distinguir entre las tres medias. A continuación, \begin{align} \beta_{n+m} &= \beta_0 + \frac{1}{2} \sum\limits_{i=1}^{n+m} (x_i - \overline{x}_{1:n+m})^2 + \frac{\kappa_0 (n+m) (\overline{x}_{1:n+m} - \mu_0)^2}{2(\kappa_0 + n+m)}\\ &= \beta_0 + \frac{1}{2} \sum\limits_{i=1}^{n} (x_i - \overline{x}_{1:n}+\overline{x}_{1:n}-\overline{x}_{1:n+m})^2\\ &\quad + \frac{1}{2} \sum\limits_{i=n+1}^{n+m} (x_i - \overline{x}_{(n+1):(n+m)}+ \overline{x}_{(n+1):(n+m)}- \overline{x}_{1:n+m})^2\\ &\quad + \frac{\kappa_0 (n\overline{x}_{1:n}+m\overline{x}_{(n+1):(n+m)} - (n+m)\mu_0)^2}{2(\kappa_0 + n+m)(n+m)}\\ &= \beta_0 + \frac{1}{2} \sum\limits_{i=1}^{n} (x_i - \overline{x}_{1:n})^2+\frac{1}{2}n(\overline{x}_{1:n}-\overline{x}_{1:n+m})^2\\ &\quad + \frac{1}{2} \sum\limits_{i=n+1}^{n+m} (x_i - \overline{x}_{(n+1):(n+m)})^2+ \frac{1}{2}m(\overline{x}_{(n+1):(n+m)}- \overline{x}_{1:n+m})^2\\ &\quad + \frac{\kappa_0 (n\overline{x}_{1:n} - n\mu_0)^2}{2(\kappa_0 + n+m)(n+m)}+ \frac{\kappa_0 (m\overline{x}_{(n+1):(n+m)} - m\mu_0)^2}{2(\kappa_0 + n+m)(n+m)}\\ &\quad + \frac{2\kappa_0 (n\overline{x}_{1:n}-n\mu_0)(m\overline{x}_{(n+1):(n+m)} - m\mu_0)}{2(\kappa_0 + n+m)(n+m)}\\ &= \beta_n + \frac{1}{2} \sum\limits_{i=n+1}^{n+m} (x_i - \overline{x}_{(n+1):(n+m)})^2 + R_{n,m}\end{align} con \begin{align} R_{n,m}&=\frac{1}{2}n(\overline{x}_{1:n}-\overline{x}_{1:n+m})^2+ \frac{1}{2}m(\overline{x}_{(n+1):(n+m)}- \overline{x}_{1:n+m})^2\\ &\quad + \frac{\kappa_0 n^2(\overline{x}_{1:n} - \mu_0)^2}{2(\kappa_0 + n+m)(n+m)}+ \frac{\kappa_0 m^2(\overline{x}_{(n+1):(n+m)} - \mu_0)^2}{2(\kappa_0 + n+m)(n+m)}\\ &\quad + \frac{2\kappa_0 nm(\overline{x}_{1:n}-\mu_0)(\overline{x}_{(n+1):(n+m)} - \mu_0)}{2(\kappa_0 + n+m)(n+m)}- \frac{\kappa_0 n(\overline{x}_{1:n} - \mu_0)^2}{2(\kappa_0 + n)}\\ &=\frac{nm}{2(n+m)}(\overline{x}_{1:n}-\overline{x}_{(n+1):(n+m)})^2\\ &\quad + \frac{\kappa_0 n^2(\overline{x}_{1:n} - \mu_0)^2}{2(\kappa_0 + n+m)(n+m)}+ \frac{\kappa_0 m^2(\overline{x}_{(n+1):(n+m)} - \mu_0)^2}{2(\kappa_0 + n+m)(n+m)}\\ &\quad + \frac{2\kappa_0 nm(\overline{x}_{1:n}-\mu_0)(\overline{x}_{(n+1):(n+m)} - \mu_0)}{2(\kappa_0 + n+m)(n+m)} - \frac{\kappa_0 n(\overline{x}_{1:n} - \mu_0)^2}{2(\kappa_0 + n)}\\ &= \overline{x}_{(n+1):(n+m)}^2 \left\{ \frac{nm}{2(n+m)} + \frac{\kappa_0 m^2}{2(\kappa_0 + n+m)(n+m)}\right\}\\ &\quad + \overline{x}_{(n+1):(n+m)} \left\{ - \frac{2nm}{2(n+m)}\overline{x}_{1:n} - \frac{2\kappa_0 m^2\mu_0}{2(\kappa_0 + n+m)(n+m)}\right.\\ &\qquad\qquad\qquad\left. + \frac{2\kappa_0 nm(\overline{x}_{1:n}-\mu_0)}{2(\kappa_0 + n+m)(n+m)} \right\}\\ &\quad+ \frac{nm}{2(n+m)}\overline{x}_{1:n}^2+ \frac{\kappa_0 n^2(\overline{x}_{1:n} - \mu_0)^2}{2(\kappa_0 + n+m)(n+m)} - \frac{2\kappa_0 nm(\overline{x}_{1:n}-\mu_0)\mu_0}{2(\kappa_0 + n+m)(n+m)}- \frac{\kappa_0 n(\overline{x}_{1:n} - \mu_0)^2}{2(\kappa_0 + n)}+ \frac{\kappa_0 m^2\mu_0^2}{2(\kappa_0 + n+m)(n+m)}\\ &=\overline{x}_{(n+1):(n+m)}^2 \frac{\kappa_nm}{2(\kappa_n +m)}\\ &\quad +\overline{x}_{(n+1):(n+m)}\overbrace{\frac{2m}{2(\kappa_n +m)(n+m)} \left\{ -[\kappa_n+m-\kappa_0]n \overline{x}_{1:n}-[n+m]\kappa_0\mu_0\right\}}^{-2\frac{\kappa_nm}{2(\kappa_n+m)}\mu_n}\\ &\quad +\frac{n\overline{x}_{1:n}^2}{2(\kappa_n+m)\kappa_n(n+m)} \overbrace{\left\{(\kappa_n+m)\kappa_nm+\kappa_0\kappa_nn-\kappa_0(\kappa_n+m)(n+m)\right\}}^{mn^2+nm^2=mn(m+n)}\\ &\quad -2\frac{n\overline{x}_{1:n}\kappa_0\mu_0}{2(\kappa_n+m)\kappa_n(n+m)}\overbrace{\left\{ n\kappa_n+m\kappa_n-(\kappa_n+m)(n+m)\right\}}^{-(n+m)m}\\ &\quad +\frac{\kappa_0\mu_0^2}{2(\kappa_n+m)\kappa_n(n+m)}\overbrace{\left\{ n^2\kappa_n+2nm\kappa_n+m^2\kappa_n-n(\kappa_n+m)(n+m)\right\}}^{\kappa_0m(n+m)}\\ &=\overline{x}_{(n+1):(n+m)}^2 \frac{\kappa_nm}{2(\kappa_n +m)} -2\overline{x}_{(n+1):(n+m)}\mu_n \frac{\kappa_nm}{2(\kappa_n +m)}+ \mu_n^2 \frac{\kappa_nm}{2(\kappa_n +m)}\\ &= \frac{\kappa_n m }{2(\kappa_n + m)} \, (\overline{x}_{(n+1):(n+m)} - \mu_n)^2 \end{align}

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X