Processing math: 100%

29 votos

Posterior normal multivariante

Es una pregunta muy sencilla pero no encuentro la derivación en ningún sitio de internet o en un libro. Me gustaría ver la derivación de cómo un bayesiano actualiza una distribución normal multivariante. Por ejemplo: imaginemos que

P(x|,)=N(μ,Σ)P(μ)=N(μ0,Σ0).

Tras observar un conjunto de x1...xn Me gustaría calcular P(μ|x1...xn) . Sé que la respuesta es P(μ|x1...xn)=N(μn,Σn) donde

μn=Σ0(Σ0+1nΣ)1(1nni=1xi)+1nΣ(Σ0+1nΣ)1μ0Σn=Σ0(Σ0+1nΣ)11nΣ

Estoy buscando la derivación de este resultado con todo el álgebra matricial intermedia.

Cualquier ayuda es muy apreciada.

13voto

Silvercode Puntos 438

Con las distribuciones de nuestros vectores aleatorios:

xi|μN(μ,Σ)

μN(μ0,Σ0)

Por la regla de Bayes, la distribución posterior se parece:

p(μ|{xi})p(μ)Ni=1p(xi|μ)

Así que:

lnp(μ|{xi})=12Ni=1(xiμ)Σ1(xiμ)12(μμ0)Σ10(μμ0)+const

=12NμΣ1μ+Ni=1μΣ1xi12μΣ10μ+μΣ10μ0+const

=12μ(NΣ1+Σ10)μ+μ(Σ10μ0+Σ1Ni=1xi)+const

=12(μ(NΣ1+Σ10)1(Σ10μ0+Σ1Ni=1xi))(NΣ1+Σ10)(μ(NΣ1+Σ10)1(Σ10μ0+Σ1Ni=1xi))+const

Que es la densidad logarítmica de una gaussiana:

μ|{xi}N((NΣ1+Σ10)1(Σ10μ0+Σ1Ni=1xi),(NΣ1+Σ10)1)

Usando la identidad de Woodbury en nuestra expresión para la matriz de covarianza:

(NΣ1+Σ10)1=Σ(1NΣ+Σ0)11NΣ0

Lo que proporciona la matriz de covarianza en la forma que la OP quería. Usando esta expresión (y su simetría) en la expresión para la media tenemos:

Σ(1NΣ+Σ0)11NΣ0Σ10μ0+1NΣ0(1NΣ+Σ0)1ΣΣ1Ni=1xi

=Σ(1NΣ+Σ0)11Nμ0+Σ0(1NΣ+Σ0)1Ni=1(1Nxi)

Que es la forma requerida por el OP para la media.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X