Derivación del paso M en el algoritmo EM para la mezcla de gaussianos

Question

Derivación del paso M en el algoritmo EM para la mezcla de gaussianos

Preguntado el 29 de Octubre, 2016: Cuando se hizo la pregunta
2872 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Estoy tratando de derivar las ecuaciones de estimación de parámetros para el Paso M de la maximización de expectativas (EM) algoritmo para una mezcla de gaussianos cuando todos los gaussianos comparten la misma matriz de covarianza $\mathbf{\Sigma}$ .

Reconocimiento de patrones y aprendizaje automático de Bishop tiene una sección sobre EM para mezclas gaussianas, e incluye una derivación del paso M cuando todas las $K$ Los gaussianos tienen diferentes matrices de covarianza $\mathbf{\Sigma_k}$ . Creo que si puedo entender bien esta derivación, puedo modificarla para conseguir lo que quiero.

Entiendo la derivación dada por Bishop para la ecuación del paso M para $\mathbf{\mu_k}$ . Sin embargo, el libro no muestra pasos detallados para la derivación del paso M para $\mathbf{\Sigma_k}$ . Cuando intenté deducirlo yo mismo calculando $\frac{\partial \mathbf{L}}{\partial \mathbf{\Sigma_k}}$ y poniéndolo a 0, me he encontrado con la siguiente derivada que no sé cómo tratar:

$$ \frac{\partial}{\partial \mathbf{\Sigma_k}} \left ( (2\pi)^{-d/2}|\mathbf{\Sigma_k}|^{-1/2}e^{-\frac{1}{2}(x-\mathbf{\mu_k})^T\mathbf{\Sigma_k}^{-1}(x-\mathbf{\mu_k})}\right ) $$

Básicamente, es la derivada de la pdf gaussiana multivariante con respecto a la matriz de covarianza. ¿Cómo puedo calcular esta derivada? He calculado la derivada de la logaritmo de esta función antes al estudiar los clasificadores Gaussian Bayes, así que eso me hace pensar que he cometido un error en alguna parte.

Preguntado el 29 de Octubre, 2016 por Fiona

Answer 1

1 Respuestas

Answer 2

4voto

Fiona Puntos 41

He encontrado la respuesta y la publico para la posteridad. Mencioné en la pregunta que el cálculo de la derivada de la logaritmo del PDF era más fácil. Resulta que esto se puede utilizar para calcular la derivada del propio PDF:

$$ \frac{\partial \ln (f)}{\partial \mathbf{\Sigma}_k} = \frac{1}{f} \frac{\partial f}{\partial \mathbf{\Sigma}_k}\\ \Rightarrow \frac{\partial f}{\partial \mathbf{\Sigma}_k} = f \cdot\frac{\partial \ln (f)}{\partial \mathbf{\Sigma}_k} $$

Además, resulta que tomando la derivada de la PDF con respecto a $\mathbf{\Sigma}^{-1}$ es más fácil y conduce a la misma respuesta.

Respondido el 31 de Octubre, 2016 por Fiona (41 Puntos )

Derivación del paso M en el algoritmo EM para la mezcla de gaussianos

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Derivación del paso M en el algoritmo EM para la mezcla de gaussianos

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: