9 votos

¿Qué son las mezclas de escala gaussiana? ¿Y cómo generar muestras de mezclas de escala gaussiana con un parámetro de escala y ubicación dados?

¿Qué es una mezcla de escala gaussiana? ¿Es diferente de la mezcla gaussiana?

Cuál es la ubicación global y el parámetro de escala de una mezcla gaussiana dada y cómo generar una muestra de una $\mu$ y $\sigma^2$ .

15voto

kjetil b halvorsen Puntos 7012

La pdf (función de densidad de probabilidad) normal (o gaussiana) es $$ \DeclareMathOperator{\E}{E} \DeclareMathOperator{\Var}{Var} f(x;\mu,\sigma^2) = \frac1{\sqrt{2\pi\sigma^2}}\cdot \exp\left(-\frac12 (\frac{x-\mu}{\sigma})^2 \right) $$ Aquí $\mu$ es el parámetro de localización (media) y $\sigma^2$ es el parámetro de escala (varianza). Una mezcla gaussiana suele ser cuando tomamos una distribución gaussiana con diferentes parámetros de localización, pero una mezcla de escala se refiere al caso con parámetros de escala variables, por lo que viene dada por (una mezcla discreta) $$ \sum_{i=1}^n \pi_i \cdot f(x; \mu, \sigma_i^2) $$ donde los pesos $\pi_i$ son no negativos y suman 1. También podemos tener una mezcla continua $$ \int_0^\infty g(\sigma^2) f(x;\mu,\sigma^2) \; d\sigma^2 $$ donde $g(\sigma^2)$ es una función de densidad.

También se pueden tener mezclas en las que varían ambos parámetros. Hay algunos posts de Cross Validated sobre la estimación de las distribuciones de mezcla a partir de los datos, véase https://stats.stackexchange.com/search?q=estimating+mezcla+distribuciones

La pregunta sobre la expectativa y la varianza de la distribución de la mezcla: En la mezcla de escala, todos los componentes tienen la misma expectativa, por lo que esa será también la expectativa de la mezcla. Esto se puede ver formalmente utilizando el teorema de la doble expectativa como se indica a continuación. Vamos a ver el caso general, donde ambos parámetros pueden variar, por lo que podemos escribir la distribución de la mezcla como $X | I \sim \text{N}(\mu_i, \sigma^2_i)$ donde la variable condicionante $I$ tienen la distribución $\{ \pi_i\}$ en un caso discreto, $g(\cdot)$ en caso continuo. En el caso general, $g(\cdot)$ debe ser una densidad en ambos $\mu$ y $\sigma^2$ indicamos qué unión/margen estamos utilizando mediante los argumentos. Entonces la expectativa de la mezcla se convierte (ya que las variantes no contribuyen en nada a la expectativa) en $$ \mu = \E X = \E [\E X|I] =\begin{cases} \sum \pi_i \mu_i &~ \text{discrete case} ~ \\ \int_{-\infty}^\infty \mu g(\mu) \; d \mu &~ \text{continuous case} ~ \end{cases} $$ Para la varianza necesitamos el teorema de la doble varianza, que es $\Var X = \E \Var X|I + \Var \E X|I$ , lo que da: $$ \Var X = \E \Var X|I + \Var \E X|I = \sum \pi_i \sigma^2_i + \sum \pi_i (\mu_i-\mu)^2 $$ y dejo el caso continuo como ejercicio.

Así que para la generación aleatoria: La distribución de la mezcla puede ser representada estocásticamente por (como arriba) $$ X | I=i \sim \text{N}(\mu_i, \sigma^2_i) $$ y luego debemos especificar la distribución de $I$ . Para el caso discreto, digamos $P(I=i)=\pi_i, i=1,2\dots,n$ .

A continuación, la simulación sigue esto, pero en el orden inverso: Empezamos con $I$ y, en función del resultado, simulamos $X|I=i$ . Para un ejemplo concreto, digamos que $I$ tiene una distribución de Poisson con parámetro (media) $\lambda=1$ et $X|I=i \sim \text{N}(\mu=i, \sigma^2=i^2)$ . Podemos implementar esto en R de la siguiente manera:

> I <- rpois(10000,1.0)
> X  <- rnorm(10000,I,I)
> hist(X,prob=TRUE)

el histograma que se muestra a continuación:

enter image description here

6voto

stovroz Puntos 111

Una mezcla de escalas gaussianas (no confundir con una mezcla de gaussianas) es una variable aleatoria $Y$ que puede expresarse como la siguiente distribución de la mezcla $$ Y|(Z=z) \sim N(\mu,z^{-1}\Sigma) $$ donde Z es una variable aleatoria con dominio positivo. Para más detalles, véanse estos documentos

https://academic.oup.com/biomet/article-abstract/74/3/646/238820

https://www.jstor.org/stable/2984774

Un ejemplo es cuando $Z\sim gamma(d/2,d/2)$ entonces tenemos la multivariante $t$ distribución con $d$ grados de libertad. Para simular a partir de estas distribuciones, primero se simula una observación $z$ de $Z$ y luego simular su variable de $N(\mu,z^{-1}\Sigma)$ .

Una mezcla gaussiana es lo que respondió kjetil b halvorsen

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X