33 votos

¿Por qué una mezcla de dos variables con distribución normal sólo es bimodal si sus medias difieren al menos dos veces la desviación típica común?

Bajo mezcla de dos distribuciones normales:

https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions

"Una mezcla de dos distribuciones normales tiene cinco parámetros que estimar: las dos medias, las dos varianzas y el parámetro de mezcla. Una mezcla de dos distribuciones normales con desviaciones estándar iguales es bimodal sólo si sus medias difieren en al menos dos veces la desviación estándar común."

Estoy buscando una derivación o explicación intuitiva de por qué esto es cierto. Creo que se puede explicar en forma de una prueba t de dos muestras:

$$\frac{\mu_1-\mu_2}{\sigma_p}$$

donde $\sigma_p$ es la desviación estándar agrupada.

59voto

Johnny Puntos 151

Esta figura del artículo enlazado en la wiki ofrece una buena ilustración: enter image description here

La prueba que proporcionan se basa en el hecho de que las distribuciones normales son cóncavas dentro de una DE de su media (la DE es el punto de inflexión de la pdf normal, donde pasa de cóncava a convexa). Por lo tanto, si se suman dos fdp normales (en proporciones iguales), siempre que sus medias difieran en menos de dos DE, la fdp-suma (es decir, la mezcla) será cóncava en la región comprendida entre las dos medias y, por lo tanto, el máximo global debe estar en el punto situado exactamente entre las dos medias.

Referencia: Schilling, M. F., Watkins, A. E., & Watkins, W. (2002). ¿Es la estatura humana bimodal? The American Statistician, 56(3), 223-229. doi:10.1198/00031300265

15voto

jldugger Puntos 7490

Este es un caso en el que las imágenes pueden ser engañosas, porque este resultado es una característica especial de normal mezclas: ¡un análogo no es necesariamente válido para otras mezclas, incluso cuando los componentes son distribuciones unimodales simétricas! Por ejemplo, una mezcla igual de dos distribuciones t de Student separadas por un poco menos del doble de su desviación estándar común será bimodal. Por lo tanto, para obtener una visión real, tenemos que hacer algunos cálculos o apelar a las propiedades especiales de las distribuciones normales.


Elegir las unidades de medida (recentrando y reescalando según sea necesario) para situar las medias de las distribuciones de los componentes en $\pm\mu,$ $\mu\ge 0,$ y hacer la unidad de su variante común. Sea $p,$ $0 \lt p \lt 1,$ sea la cantidad del componente mayor de la media en la mezcla. Esto nos permite expresar la densidad de la mezcla en toda su generalidad como

$$\sqrt{2\pi}f(x;\mu,p) = p \exp\left(-\frac{(x-\mu)^2}{2}\right) + (1-p) \exp\left(-\frac{(x+\mu)^2}{2}\right).$$

Dado que las densidades de ambos componentes aumentan cuando $x\lt -\mu$ y disminuye cuando $x\gt \mu,$ los únicos modos posibles se dan cuando $-\mu\le x \le \mu.$ Encuéntrelos diferenciando $f$ con respecto a $x$ y ponerlo a cero. Eliminando los coeficientes positivos obtenemos

$$0 = -e^{2x\mu} p(x-\mu) + (1-p)(x+\mu).$$

Realizando operaciones similares con la segunda derivada de $f$ y sustituyendo $e^{2x\mu}$ por el valor determinado por la ecuación anterior nos dice que el signo de la segunda derivada en cualquier punto crítico es el signo de

$$f^{\prime\prime}(x;\mu,p) \propto \frac{(1+x^2-\mu^2)}{x-\mu}.$$

Dado que el denominador es negativo cuando $-\mu\lt x \lt \mu,$ el signo de $f^{\prime\prime}$ es la de $-(1-\mu^2 + x^2).$ Está claro que cuando $\mu\le 1,$ el signo debe ser negativo. Sin embargo, en una distribución multimodal (porque la densidad es continua), debe haber un antimodal entre dos modos cualesquiera, donde el signo es no negativo. Así, cuando $\mu$ es menor que $1$ (la SD), la distribución debe ser unimodal.

Dado que la separación de los medios es $2\mu,$ la conclusión de este análisis es

Una mezcla de distribuciones normales es unimodal siempre que las medias estén separadas por no más del doble de la desviación estándar común.

Eso es lógicamente equivalente a la afirmación de la pregunta.

14voto

manku Puntos 111

Comentario de arriba pegado aquí para la continuidad:

"[F]ormalmente, para una mezcla 50:50 de dos distribuciones normales con la misma SD σ, si se escribe la densidad $$f(x)=0.5g_1(x)+0.5g_2(x)$$ en forma completa mostrando los parámetros, verás que su segunda derivada cambia de signo en el punto medio entre las dos medias cuando la distancia entre medias aumenta de menos de 2σ a más."

El comentario continúa:

En cada caso las dos curvas normales que se "mezclan tienen $\sigma=1.$ De izquierda a derecha las distancias entre medias son $3\sigma, 2\sigma,$ y $\sigma,$ respectivamente. La concavidad de la densidad de la mezcla en el punto medio (1,5) entre las medias cambia de negativa, a cero, a positiva.

enter image description here

Código R para la figura:

par(mfrow=c(1,3))
  curve(dnorm(x, 0, 1)+dnorm(x,3,1), -3, 7, col="green3", 
    lwd=2,n=1001, ylab="PDF", main="3 SD: Dip")
  curve(dnorm(x, .5, 1)+dnorm(x,2.5,1), -4, 7, col="orange", 
    lwd=2, n=1001,ylab="PDF", main="2 SD: Flat")
  curve(dnorm(x, 1, 1)+dnorm(x,2,1), -4, 7, col="violet", 
    lwd=2, n=1001, ylab="PDF", main="1 SD: Peak")
par(mfrow=c(1,3))

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X