8 votos

Límite la distancia de Hausdorff modificado

Estoy haciendo un proyecto de investigación de verano en la validación del modelo de indicadores para aplicaciones en el derrame de petróleo en el modelado. La idea es cambiar una sola variable en un modelo de una en una hasta un cierto "métrica" es minimizado entre el modelo y la observación. Repitiendo el proceso para todas las variables relevantes se traduce en una fuerte aproximación de los datos observados. No hay ningún estándar, sin embargo, desde la técnica de modelado es nuevo, y esperemos que mejora de forma significativa sobre los antiguos HYCOM modelos. Mi papel es el de desarrollar y comparar las métricas que son lo suficientemente exactos para nuestras necesidades.

En la actualidad, he tenido buen éxito con el denominado " Modificación de la Distancia de Hausdorff dado por Dubuisson y Jain (http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=576361&tag=1):

\begin{equation*} d_{MH}(A,B) = \max\left\{\frac{1}{|A|}\sum_{a\in A}d(a,B), \frac{1}{|B|}\sum_{b\in B}d(b,A)\right\}, \end{ecuación*} donde $A,B\subset\mathbb{R}^n$ tal que $|A|,|B|<\infty$. También, $d(a,B)=\min_{b\in B}\|a-b\|$, y del mismo modo para $d(b,A)$.

La métrica ha desempeñado muy bien en varias de las pruebas, mostrando el deseado monotonía con respecto a los diferentes estándares homotopies (traducción, la escala, el ruido). Además, obtuvo una calificación de muy bueno en una prueba de reconocimiento facial corrí el uso de imágenes en escala de grises de la EN$\&$T de la Base de datos de Caras (http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html).

El problema, según lo declarado por los autores, es que la función no es un topológica de la métrica en el espacio de todos los subconjuntos finitos de $\mathbb{R}^n$ ya que falla en el triángulo de la desigualdad. Para el pursposes de nuestras aplicaciones, esto no parece ser un gran problema, ya que hace tan bien en la práctica. Sin embargo, me gustaría, al menos, desarrollar algunos de los límites sobre este mal comportamiento. Es decir, estoy atascado en dos cosas:

(1) necesito un buen contraejemplo a la desigualdad de triángulo. Alguna idea? He tenido problemas para subir con uno, y los autores no citan.

(2) Mi intuición me dice que el contraejemplo(s) involucrará a los conjuntos con un pequeño número de puntos, y si este es el caso que me gustaría ver si me pueden desarrollar una aproximación de la forma $d(A,C)\leq d(A,B)+d(B,C)+\epsilon(n)$ donde $n=\max(|A|,|B|)$ $\epsilon:\mathbb{Z}^+\to\mathbb{R}$ disminuye monótonamente. Por tanto, para tamaños de muestra grandes, $d_{MH}$ es esencialmente una verdadera métrica topológica.

Cualquier sugerencias sobre cómo proceder? Estoy un poco atascado.. cualquier sugerencia sería muy útil.

Jon

EDIT 1: Después de más pruebas, resulta que el valor sugerido de $K=3/2$ es demasiado pequeño. Yo todavía no he de alcanzar los valores de $K>3/2$ en simulaciones en MATLAB $\mathbb{R}^n$$n\in\{2,3,4\}$, sin embargo los valores alrededor de $K=3$ son necesarios para $n\not\in \{2,3\}$.

plot

El anterior gráfico muestra una simulación de este tipo. Para cada una de las $k=1,...,10$, he trazado al azar de los conjuntos de puntos de $A,B,C\subset\mathbb{R}^k$ y calculadas $d_{MH}(A,B),d_{MH}(B,C)$, y $d_{MH}(A,C)$ $10^5$ veces. Luego de encontrar el valor máximo de $K$ a la fuerza de la propuesta de inquality para celebrar. El $x$-eje indica la dimensión y la $y$-eje indica el $K$ valores. No estoy muy seguro de qué hacer con eso todavía. Creo que es claro que, si un delimitador de la Modificación de la Distancia de Hausdorff existe, debe ser un multiplicativo. Se basa en una importante evidencia empírica, resulta dudoso que la función está acotada. El comportamiento en $\mathbb{R}^k$ $k=1,2,3$ tiene sentido, pero ¿por qué el aumento de la conducta de las dimensiones superiores??

EDIT 2: Como se pide, he aquí un ejemplo en $\mathbb{R}$ que las fuerzas de $K>2$: \begin{align*} A &= \{4,11\}\\ B &= \{2,13,14,18,20,26,61\}\\ C &= \{5,53,58,65,79,81\}. \end{align*} A continuación,$d_{MH}(A,B)=12.5714,d_{MH}(B,C)=10.2857,$$d_{MH}(A,C)=47$. Por lo tanto el más pequeño $K\in\mathbb{R}$ tal que $d_{MH}(A,C)\leq K(d_{MH}(A,B)+d_{MH}(B,C))$$K=2.0563$.

La trama no es muy esclarecedor, pero voy a incluir, según lo solicitado: KinR

Edit 3: Los siguientes límites han sido desmentidas:

\begin{align*} 1.& d_{MH}(A,C)\leq d_{MH}(A,B)+d_{MH}(B,C)+\epsilon;\\ 2.& d_{MH}(A,C)\leq K(d_{MH}(A,B)+d_{MH}(B,C));\\ 3.& d_{MH}(A,C)\leq K\cdot\max\{d_{MH}(A,B),d_{MH}(B,C)\}. \end{align*}

Contraejemplos para 1 y 2 se pueden encontrar a continuación. Para 3, elija $A,B,C$, como en (6). Luego, dejando $\delta$ el valor de la distancia mínima de un punto en $N_{n,r}$$N$$N\in\{1,2\}$, tenemos: \begin{equation*} d(A,C)\leq\frac{n}{n+1}(n\delta+1), ~~~ d(A,B)\geq\frac{n\delta+1}{n+1},~~~ d(B,C)\geq \delta. \end{ecuación*} Por lo tanto \begin{align*} d(A,C)\leq K\cdot\max\{d(A,B),d(B,C)\} &\Leftrightarrow K\geq\frac{d(A,C)}{\max\{d(A,B),d(B,C)\}}\\ &\Leftrightarrow K\geq \frac{1+r}{1/n+\delta}\rightarrow \infty \end{align*} como $r\rightarrow 0$$n\rightarrow\infty$.

3voto

ˈjuː.zɚ79365 Puntos 1688

Un simple contraejemplo es $$A=\{1,2\}, B=\{2,3\}, C=\{3,4\} \tag1$$ all considered as subsets of $\mathbb R$. Indeed, $d_{MH}(a,B)=1/2=d_{MH}(B,C)$, but $d_{MH}(a,C)=3/2$.

Hay algunos problemas con la propuesta de la desigualdad $$d(A,C)\leq d(A,B)+d(B,C)+\epsilon(n) \tag{2}$$

  1. Escala por $\lambda>0$. La sustitución de $A,B,C$ por $\lambda A=\{\lambda x: x\in A\}$, $\lambda B$ y $\lambda C$ resultados en todas las distancias multiplicado por $\lambda$. Pero el término $\epsilon(n)$ no de escala, y esto se va a romper la desigualdad (2). Por ejemplo, poniendo $A=\{\lambda,2\lambda\}$, $B=\{2\lambda,3\lambda\}$, y $C=\{3\lambda,4\lambda\}$ en (2) obtenemos $$\frac32\lambda \leq \lambda+\epsilon(2) \tag{3}$$ que no puede ser verdad con $\epsilon(2)$ independiente de $\lambda$.

  2. La duplicación de puntos. Desde un contraejemplo con conjuntos pequeños, tales como (1) puedo construir contraejemplos con casi el mismo MH-distancias y arbitrariamente grandes conjuntos. Una manera de hacer esto es para reemplazar cada conjunto en (1) con la unión de sus traduce por pequeñas cantidades, tales como $$\bigcup_{k=0}^{1000}(A+k\cdot 10^{-6})=\{1,1+10^{-6},\dots, 1+10^{-3}, 2,2+10^{-6},\dots, 2+10^{-3}\} \tag4$$ Ahora cada conjunto ha $2000$ elementos, y ninguno de los MH-distancias cambiado por más de $10^{-3}$.

Lo que podría ser cierto es una desigualdad con universal multiplicativo constante $K>1$, es decir, $$d(A,C)\leq K(d(A,B)+d(B,C)) \tag{5}$$ Ejemplo (1) muestra que el $K$ debe ser de al menos $3/2$. Hasta ahora no he encontrado ninguna ejemplos que requieren $K>3/2$.

Añadido: por Desgracia, (5) no tiene cualquiera, para cualquier constante universal de $K$. Para describir un contraejemplo, yo uso la notación $a_{n,r}$, lo que significa $n$ distintos puntos de la $r$-barrio de punto de $a$. Por ejemplo, el conjunto (4) puede ser escrito como $\{1_{1000,1/1000}, 2_{1000,1/1000}\}$. Considere los conjuntos $$A=\{1\},\ B=\{1_{n,r},2\}, \ C=\{1, 2_{n,r}\} \tag6$$ Aquí $$\begin{split}d_{MH}(A,B)&\le \frac{1}{n+1}(nr+1) \le r+\frac{1}{n}\\ d_{MH}(B,C) &\le \frac{1}{n+1}(n+1)r = r\\ d_{MH}(A,C) &\ge \frac1{n+1}n(1-r) \end{split} \tag7$$ Como $n\to\infty$$r\to 0$, las dos primeras distancias tienden a $0$ mientras $d(A,C)\to 1$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X