La tierra de la empresa de Mudanzas Distancia (EMD) entre dos Gaussianas

Question

La tierra de la empresa de Mudanzas Distancia (EMD) entre dos Gaussianas

Preguntado el 29 de Enero, 2014: Cuando se hizo la pregunta
571 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Hay una forma cerrada de la fórmula (o algún tipo de límite en) el EMD entre el$x_1\sim N(\mu_1, \Sigma_1)$$x_2 \sim N(\mu_2, \Sigma_2)$?

Preguntado el 29 de Enero, 2014 por AreusAstarte

Answer 1

1 Respuestas

Answer 2

37voto

Bauna Puntos 176

$\DeclareMathOperator\EMD{\mathrm{EMD}} \DeclareMathOperator\E{\mathbb{E}} \DeclareMathOperator\N{\mathcal{N}} \DeclareMathOperator\tr{\mathrm{tr}} \newcommand\R{\mathbb R}$El la tierra se mueve la distancia puede ser escrito como $\EMD(X, Y) = \inf \E \lVert X - Y \rVert$, donde el infimum se toma sobre todas las distribuciones conjuntas de $X$ $Y$ con la correcta marginales. Esto también es conocido como el primer Wasserstein distancia, que es $W_p = \inf \left( \E \lVert X - Y \rVert^p \right)^{1/p}$ con el mismo infimum.

Tenga en cuenta que, por la desigualdad de Jensen, $\left( \E \lVert X - Y \rVert \right)^2 \le \E \lVert X - Y \rVert^2$. Por lo tanto $W_1 \le W_2$.

Dowson y Landau (1982) establecen que $$ W_2( \N(\mu_x, \Sigma_x), \N(\mu_y, \Sigma_y) )^2 = \lVert \mu_x - \mu_y \rVert^2 + \tr\left( \Sigma_x + \Sigma_y - 2 (\Sigma_x \Sigma_y)^{1/2} \right) ,$$ y así tenemos un límite superior en $\EMD = W_1$.

También tenemos una bastante trivial límite inferior: de nuevo por la desigualdad de Jensen (ya que las normas son convexas), $$\E \lVert X - Y \rVert \ge \lVert \E (X - Y) \rVert = \lVert \mu_x - \mu_y \rVert,$$ así que el EMD es siempre, al menos, la distancia entre los medios (para cualquier distribución).

El siguiente enfoque podría ser utilizado para una respuesta exacta, modulo dos partes en las que no estoy seguro acerca de.

Podemos escribir $X = \mu_x + C_x Z$, $Y = \mu_y + C_y Z$, donde $X \sim \N(\mu_x, C_x^T C_x)$, $Y \sim \N(\mu_y, C_y^T C_y)$, $Z \sim \N(0, I)$. Vamos $\Sigma_x := C_x^T C_x$, $\Sigma_y := C_y^T C_y$.

Intuitivamente, parece razonable que la distribución de lograr el infimum es exactamente esta distribución: mover cada infinitesimal de probabilidad de masa de $X$ a la sección correspondiente de probabilidad de masa para $Y$, de acuerdo a sus estandarizaciones. No tengo una prueba de ello. En el caso unidimensional, parece bastante razonable; estoy menos seguro que en las dimensiones superiores.

Por ahora, vamos a suponer que esto es verdad y vamos a calcular el valor de $\EMD$ esto implicaría. La distancia $\lVert X - Y \rVert$ luego $\lVert D \rVert$, donde $$ D := X - Y = \mu_x - \mu_y + (C_x - C_y) z ,$$ lo que implica $D$ es normal con una media de $\mu_x - \mu_y$ y la varianza $$ (C_x - C_y)^T (C_x - C_y) = \Sigma_x + \Sigma_y - C_x^T C_y - C_y^T C_x .$$ El EMD es, a continuación,$\E \lVert D \rVert$. Lamentablemente no sé cómo decirlo para multivariante normales (aunque le he pedido), pero podemos utilizar un simple límite superior basada en la desigualdad de Jensen (como en los vinculados pregunta) para obtener \begin{align} \left( \E \lVert D \rVert \right)^2 &\le \E \lVert D \rVert^2 = \lVert \mu_x - \mu_y \rVert^2 + \tr\left( \Sigma_x + \Sigma_y - 2 C_y^T C_x \right) ,\end{align} lo cual está de acuerdo con el resultado en base a $W_2$. Si la conjetura de distribución conjunta es correcta, el verdadero valor de la EMD sería $\E \lVert D \rVert$; aun en caso de que la distribución no lograr el infimum, es una opción válida y por lo que esta sería una más estrecha del límite superior.

Algunos menores de evidencia hacia la conjetura: en la 1d caso de$X \sim \N(\mu_x, \sigma)$$Y \sim \N(\mu_y, \sigma)$, el método de arriba da $\EMD(X, Y) = \lvert \mu_x - \mu_y \rvert$, que es la respuesta correcta. (Que puede ser verificado por la fórmula $\EMD(X, Y) = \int \lvert F_X(x) - F_X(y) \rvert \,\mathrm d x$ donde $F$ es el cdf.)

Respondido el 5 de Abril, 2015 por Bauna (176 Puntos )

La tierra de la empresa de Mudanzas Distancia (EMD) entre dos Gaussianas

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

La tierra de la empresa de Mudanzas Distancia (EMD) entre dos Gaussianas

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: