3 votos

Muestreo de un modelo multivariante de mezcla gaussiana

¿Cómo puedo generar datos multidimensionales a partir de un pdf (estimado) de mezcla gaussiana? En general, ¿cuáles serían las formas de generar datos multidimensionales a partir de una pdf? He leído que se puede utilizar el muestreo de rechazo, pero requiere estimar un límite superior para la pdf, lo cual no es una tarea fácil para mí.

5voto

throwaway Puntos 18

Un modelo de mezcla gaussiana con $k$ componentes de la mezcla pueden expresarse como:

$$p(x) = \sum_{i=1}^k \pi_i f(x \mid \mu_i, C_i)$$

donde $\pi_i, \mu_i, C_i$ son el peso de la mezcla, la media y la matriz de covarianza de la $i$ componente de la mezcla y $f_i$ es una distribución normal multivariante.

Para muestrear un punto del MMG, primero hay que elegir un componente de la mezcla dibujando $j$ de la distribución categórica con probabilidades $[\pi_1, \dots, \pi_d]$ . Esto puede hacerse utilizando un generador de números aleatorios para la distribución categórica. Otra posibilidad es extraer un número aleatorio $r$ de la distribución uniforme en $[0, 1]$ encuentre el número entero más pequeño $j$ tal que $r \le \sum_{i=1}^j \pi_i$ .

A continuación, tome una muestra del $j$ utilizando un generador de números aleatorios gaussiano multivariante con media $\mu_j$ y la matriz de covarianza $C_j$ . Esto también puede hacerse manualmente. Deje que $\Lambda_j$ sea una matriz diagonal que contenga los valores propios de $C_j$ y $V_j$ sea una matriz que contenga los vectores propios de $C_j$ a lo largo de sus columnas. Generar un vector columna $y$ con entradas extraídas i.i.d. de la distribución normal estándar. Entonces:

$$x = V_j \Lambda_j^{\frac{1}{2}} y + \mu_j$$

El muestreo a partir de un MMG es conveniente porque puede realizarse utilizando generadores de números aleatorios ampliamente disponibles. El muestreo de distribuciones multivariantes en general no es tan sencillo. En el mejor de los casos, se pueden encontrar trucos para facilitar el muestreo de distribuciones específicas. En el peor de los casos, hay que recurrir a técnicas como MCMC .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X