5 votos

Análisis cuantitativo de la estructura del modelo de mezcla gaussiana

Estoy ajustando un Modelo de Mezcla Gaussiana a datos de alta dimensión (40 dimensiones).

He entrenado el modelo mediante EM, he aprendido los parámetros y ahora quiero saberlo cuantitativamente:

¿Qué es más importante para captar la estructura de los datos, las medias o las matrices de covarianza?

Actualmente, se me ocurre medir la distancia euclidiana entre diferentes medias o el coseno de los vectores propios principales de las diferentes matrices de covarianza para medir si la dirección de la variabilidad que capta cada matriz de covarianza es similar o diferente al resto.

¿Alguna idea?

2 votos

Ambos son importantes. No puedo entender lo que quieres preguntar.

0 votos

¿Ha estudiado el análisis de componentes principales?

0 votos

¿Cómo decidiste el número de distribuciones normales en la mezcla?

0voto

Fbo Puntos 413

Consulte la investigación sobre agrupación basada en modelos de Adrian Raftery:

http://www.stat.washington.edu/raftery/Research/mbc.html

La principal preocupación de Raftery es idear métodos para identificar las distribuciones de los componentes de las mezclas gaussianas. Proporciona una multitud de herramientas útiles para la tarea que describes, muchas de las cuales están disponibles en paquetes públicos de R.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X