10 votos

Monte-Carlo para la métrica de Wasserstein

Deje $(X,d)$ ser algunos de espacio métrico y asumir que $d\leq 1$. Además, vamos a $\mu, $ $\nu$ dos Borel medidas de probabilidad en $X$ y dejar $$ \Gamma(\mu\nu) = \{\gamma \text{medida en }X\times X:\gamma(a,X) = \mu(A),\gamma(X,A) = \nu(A) \} $$ para ser el espacio de todos los acoplamientos de $\mu$$\nu$. Definir $$ W_1(\mu\nu) = \inf_{\gamma\en \Gamma(\mu\nu)}\int_{X\times X} d(x,y)\gamma(\mathrm dx\times\mathrm dy) $$ para ser el Wasserstein distancia (de orden $1$) entre $\mu$$\nu$.

Supongamos, somos capaces de establecer dos conjuntos de elementos aleatorios de acuerdo a estas distribuciones. E. g. $\{X_i\}$ es iid tal que $X_i\sim \mu$ $\{Y_j\}$ es iid tal que $Y_j\sim \nu$ donde $1\leq i,j\leq n$.

Es posible obtener resultados en $W_1(\mu,\nu)$$\{d(X_i,Y_j)\}_{ij}$, con un poco de confianza-como límites?


Algunos pensamientos: vamos a $\gamma(d):=\int_{X\times X}d(x,y)\mathrm d\gamma$. Un maniquí de forma es un fijo $\gamma$, se puede simular pares de $(X_i,Y_i)\sim \gamma$ y, a continuación, definir $$ \overline{\gamma(d)}:=\frac1n\sum d(X_i,Y_i). $$ Por la desigualdad de Hoeffding tenemos $$ \Bbb P\left(\left|\gamma(d) - \overline{\gamma(d)}\right|\geq t\right)\leq 2 \mathrm e^{-nt^2} $$ y desde $\gamma(d) \geq W_1(\mu,\nu)$ podemos conseguir algunos conservadores límites superiores en la distancia. El conservadurismo depende claramente de cómo $\gamma$ está lejos de ser el óptimo acoplamiento.

Tal vez, podemos hacer algo como eso: simular $\{X_i\}$ $\{Y_j\}$ y considerar $$ \barra W:= \frac1n\sum_{i=1}^n \min_j d(X_i,Y_j) $$ por lo tanto, "acoplamiento" $X$ $Y$ on-the-run. Pero no estoy seguro de si esto es una estimación insesgada y si permite que para algunos límites en el error.

Por favor, siéntase libre para volver a etiquetar. Tal vez voy mejor preguntar en las estadísticas.SE?

8voto

Mash See Puntos 13

Los autores del reciente libro "en la estimación empírica de métricas de probabilidad integral (2012, diario electrónico de estadística)" tienen una configuración donde presentan un estimador para métricas Wasserstein basadas en datos y donde obtienen consistencia del estimador con tasas de convergencia. Pueden ser aplicada directamente a un entorno de Monte Carlo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X