Hay una forma cerrada de la fórmula (o algún tipo de límite en) el EMD entre el$x_1\sim N(\mu_1, \Sigma_1)$$x_2 \sim N(\mu_2, \Sigma_2)$?
Respuesta
¿Demasiados anuncios?$\DeclareMathOperator\EMD{\mathrm{EMD}} \DeclareMathOperator\E{\mathbb{E}} \DeclareMathOperator\N{\mathcal{N}} \DeclareMathOperator\tr{\mathrm{tr}} \newcommand\R{\mathbb R}$El la tierra se mueve la distancia puede ser escrito como $\EMD(X, Y) = \inf \E \lVert X - Y \rVert$, donde el infimum se toma sobre todas las distribuciones conjuntas de $X$ $Y$ con la correcta marginales. Esto también es conocido como el primer Wasserstein distancia, que es $W_p = \inf \left( \E \lVert X - Y \rVert^p \right)^{1/p}$ con el mismo infimum.
Tenga en cuenta que, por la desigualdad de Jensen, $\left( \E \lVert X - Y \rVert \right)^2 \le \E \lVert X - Y \rVert^2$. Por lo tanto $W_1 \le W_2$.
Dowson y Landau (1982) establecen que $$ W_2( \N(\mu_x, \Sigma_x), \N(\mu_y, \Sigma_y) )^2 = \lVert \mu_x - \mu_y \rVert^2 + \tr\left( \Sigma_x + \Sigma_y - 2 (\Sigma_x \Sigma_y)^{1/2} \right) ,$$ y así tenemos un límite superior en $\EMD = W_1$.
También tenemos una bastante trivial límite inferior: de nuevo por la desigualdad de Jensen (ya que las normas son convexas), $$\E \lVert X - Y \rVert \ge \lVert \E (X - Y) \rVert = \lVert \mu_x - \mu_y \rVert,$$ así que el EMD es siempre, al menos, la distancia entre los medios (para cualquier distribución).
El siguiente enfoque podría ser utilizado para una respuesta exacta, modulo dos partes en las que no estoy seguro acerca de.
Podemos escribir $X = \mu_x + C_x Z$, $Y = \mu_y + C_y Z$, donde $X \sim \N(\mu_x, C_x^T C_x)$, $Y \sim \N(\mu_y, C_y^T C_y)$, $Z \sim \N(0, I)$. Vamos $\Sigma_x := C_x^T C_x$, $\Sigma_y := C_y^T C_y$.
Intuitivamente, parece razonable que la distribución de lograr el infimum es exactamente esta distribución: mover cada infinitesimal de probabilidad de masa de $X$ a la sección correspondiente de probabilidad de masa para $Y$, de acuerdo a sus estandarizaciones. No tengo una prueba de ello. En el caso unidimensional, parece bastante razonable; estoy menos seguro que en las dimensiones superiores.
Por ahora, vamos a suponer que esto es verdad y vamos a calcular el valor de $\EMD$ esto implicaría. La distancia $\lVert X - Y \rVert$ luego $\lVert D \rVert$, donde $$ D := X - Y = \mu_x - \mu_y + (C_x - C_y) z ,$$ lo que implica $D$ es normal con una media de $\mu_x - \mu_y$ y la varianza $$ (C_x - C_y)^T (C_x - C_y) = \Sigma_x + \Sigma_y - C_x^T C_y - C_y^T C_x .$$ El EMD es, a continuación,$\E \lVert D \rVert$. Lamentablemente no sé cómo decirlo para multivariante normales (aunque le he pedido), pero podemos utilizar un simple límite superior basada en la desigualdad de Jensen (como en los vinculados pregunta) para obtener \begin{align} \left( \E \lVert D \rVert \right)^2 &\le \E \lVert D \rVert^2 = \lVert \mu_x - \mu_y \rVert^2 + \tr\left( \Sigma_x + \Sigma_y - 2 C_y^T C_x \right) ,\end{align} lo cual está de acuerdo con el resultado en base a $W_2$. Si la conjetura de distribución conjunta es correcta, el verdadero valor de la EMD sería $\E \lVert D \rVert$; aun en caso de que la distribución no lograr el infimum, es una opción válida y por lo que esta sería una más estrecha del límite superior.
Algunos menores de evidencia hacia la conjetura: en la 1d caso de$X \sim \N(\mu_x, \sigma)$$Y \sim \N(\mu_y, \sigma)$, el método de arriba da $\EMD(X, Y) = \lvert \mu_x - \mu_y \rvert$, que es la respuesta correcta. (Que puede ser verificado por la fórmula $\EMD(X, Y) = \int \lvert F_X(x) - F_X(y) \rvert \,\mathrm d x$ donde $F$ es el cdf.)