9 votos

Computación de Gauss modelo de mezcla de probabilidades

Yo estaba mirando por encima de la solución a esta pregunta y me puse a pensar acerca de la computación de probabilidades para un modelo de mezcla de Gaussianas.

Supongamos que hemos ajuste algún modelo de mezcla de Gaussianas por lo que resulta en una mezcla de tres normales:

\begin{equation} X_1 \sim \mathcal{N}(\mu_1,\sigma_{1}^{2}), \quad X_2 \sim \mathcal{N}(\mu_2,\sigma_{2}^{2}), \quad X_3 \sim \mathcal{N}(\mu_3,\sigma_3^2) \end{equation} con pesos respectivos $\lambda_1, \lambda_2$, e $\lambda_3$. A partir de aquí, tome $\mathbf{X}=[X_1,X_2,X_3]$$\mathbf{\lambda}=[\lambda_1,\lambda_2,\lambda_3]$.

Normalmente, para encontrar la probabilidad de que este modelo es menor que algún valor $x$, nos encontramos con \begin{equation} \mathbf{P}(\mathbf{\lambda}\mathbf{X}^T\leq x) = \sum_{i=1}^{3} \lambda_i \mathbf{P}(X_i\leq x) \end{equation}

Es posible que me he hecho un error de codificación, pero parece que la probabilidad obtenida a partir de la fórmula anterior es diferente de la probabilidad obtenida si queremos calcular la probabilidad de una forma diferente: \begin{equation} \mathbf{P}(\mathbf{\lambda}\mathbf{X}^T\leq x)=\mathbf{P}(Y\leq x) \end{equation} donde$Y\sim\mathcal{N}(\mathbf{\lambda}\mathbf{\mu}^T,\sum_{i=1}^{3} \lambda_{i}^{2}\sigma_{i}^{2})$$\mathbf{\mu}=[\mu_1,\mu_2,\mu_3]$.

Si es un error de codificación, por favor deje un comentario y voy a eliminar esta pregunta.

11voto

jldugger Puntos 7490

Sí, las dos probabilidades debe ser diferente, porque uno es para la mezcla y el otro es para una suma. Veamos un ejemplo:

mixture and sum PDFs

El grueso curva roja es la función de densidad de probabilidad para una mezcla de tres muestras normales ($X$). Los guiones de las curvas son sus componentes (cada escala por $\lambda_i$); ellos son normales. El grueso de la curva azul es el pdf de la distribución normal con el promedio ponderado de la media y la varianza ponderada que definen $Y$; también es normal. En particular, tenga en cuenta que la posibilidad de la mezcla de disponer de varios modos (tres en este caso, entre uno y tres en general) hace que sea perfectamente claro que la mezcla no es normal en general, debido a que las distribuciones normales son unimodales.

La mezcla puede ser modelado como un proceso de dos pasos: primer sorteo de uno de los tres pares ordenados $(\mu_1, \sigma_1)$, $(\mu_2, \sigma_2)$, y $(\mu_3, \sigma_3)$ con probabilidades $\lambda_1$, $\lambda_2$, y $\lambda_3$, respectivamente. A continuación, dibuje un valor de $X$ a partir de la distribución normal especificada por los parámetros que dibujó (entendido como la media y la desviación estándar).

La media ponderada se obtiene a partir de una completamente diferente procedimiento: dibujar de manera independiente un valor de $X_1$ a partir de una distribución normal con parámetros de $(\lambda_1 \mu_1, \lambda_1 \sigma_1)$, un valor de $X_2$ a partir de una distribución normal con parámetros de $(\lambda_2 \mu_2, \lambda_2 \sigma_2)$, y un valor de $X_3$ a partir de una distribución normal con parámetros de $(\lambda_3 \mu_3, \lambda_3 \sigma_3)$. A continuación, de forma que su suma $Y = X_1+X_2+X_3$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X