Estoy haciendo un proyecto de investigación de verano en la validación del modelo de indicadores para aplicaciones en el derrame de petróleo en el modelado. La idea es cambiar una sola variable en un modelo de una en una hasta un cierto "métrica" es minimizado entre el modelo y la observación. Repitiendo el proceso para todas las variables relevantes se traduce en una fuerte aproximación de los datos observados. No hay ningún estándar, sin embargo, desde la técnica de modelado es nuevo, y esperemos que mejora de forma significativa sobre los antiguos HYCOM modelos. Mi papel es el de desarrollar y comparar las métricas que son lo suficientemente exactos para nuestras necesidades.
En la actualidad, he tenido buen éxito con el denominado " Modificación de la Distancia de Hausdorff dado por Dubuisson y Jain (http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=576361&tag=1):
\begin{equation*} d_{MH}(A,B) = \max\left\{\frac{1}{|A|}\sum_{a\in A}d(a,B), \frac{1}{|B|}\sum_{b\in B}d(b,A)\right\}, \end{ecuación*} donde $A,B\subset\mathbb{R}^n$ tal que $|A|,|B|<\infty$. También, $d(a,B)=\min_{b\in B}\|a-b\|$, y del mismo modo para $d(b,A)$.
La métrica ha desempeñado muy bien en varias de las pruebas, mostrando el deseado monotonía con respecto a los diferentes estándares homotopies (traducción, la escala, el ruido). Además, obtuvo una calificación de muy bueno en una prueba de reconocimiento facial corrí el uso de imágenes en escala de grises de la EN$\&$T de la Base de datos de Caras (http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html).
El problema, según lo declarado por los autores, es que la función no es un topológica de la métrica en el espacio de todos los subconjuntos finitos de $\mathbb{R}^n$ ya que falla en el triángulo de la desigualdad. Para el pursposes de nuestras aplicaciones, esto no parece ser un gran problema, ya que hace tan bien en la práctica. Sin embargo, me gustaría, al menos, desarrollar algunos de los límites sobre este mal comportamiento. Es decir, estoy atascado en dos cosas:
(1) necesito un buen contraejemplo a la desigualdad de triángulo. Alguna idea? He tenido problemas para subir con uno, y los autores no citan.
(2) Mi intuición me dice que el contraejemplo(s) involucrará a los conjuntos con un pequeño número de puntos, y si este es el caso que me gustaría ver si me pueden desarrollar una aproximación de la forma $d(A,C)\leq d(A,B)+d(B,C)+\epsilon(n)$ donde $n=\max(|A|,|B|)$ $\epsilon:\mathbb{Z}^+\to\mathbb{R}$ disminuye monótonamente. Por tanto, para tamaños de muestra grandes, $d_{MH}$ es esencialmente una verdadera métrica topológica.
Cualquier sugerencias sobre cómo proceder? Estoy un poco atascado.. cualquier sugerencia sería muy útil.
Jon
EDIT 1: Después de más pruebas, resulta que el valor sugerido de $K=3/2$ es demasiado pequeño. Yo todavía no he de alcanzar los valores de $K>3/2$ en simulaciones en MATLAB $\mathbb{R}^n$$n\in\{2,3,4\}$, sin embargo los valores alrededor de $K=3$ son necesarios para $n\not\in \{2,3\}$.
El anterior gráfico muestra una simulación de este tipo. Para cada una de las $k=1,...,10$, he trazado al azar de los conjuntos de puntos de $A,B,C\subset\mathbb{R}^k$ y calculadas $d_{MH}(A,B),d_{MH}(B,C)$, y $d_{MH}(A,C)$ $10^5$ veces. Luego de encontrar el valor máximo de $K$ a la fuerza de la propuesta de inquality para celebrar. El $x$-eje indica la dimensión y la $y$-eje indica el $K$ valores. No estoy muy seguro de qué hacer con eso todavía. Creo que es claro que, si un delimitador de la Modificación de la Distancia de Hausdorff existe, debe ser un multiplicativo. Se basa en una importante evidencia empírica, resulta dudoso que la función está acotada. El comportamiento en $\mathbb{R}^k$ $k=1,2,3$ tiene sentido, pero ¿por qué el aumento de la conducta de las dimensiones superiores??
EDIT 2: Como se pide, he aquí un ejemplo en $\mathbb{R}$ que las fuerzas de $K>2$: \begin{align*} A &= \{4,11\}\\ B &= \{2,13,14,18,20,26,61\}\\ C &= \{5,53,58,65,79,81\}. \end{align*} A continuación,$d_{MH}(A,B)=12.5714,d_{MH}(B,C)=10.2857,$$d_{MH}(A,C)=47$. Por lo tanto el más pequeño $K\in\mathbb{R}$ tal que $d_{MH}(A,C)\leq K(d_{MH}(A,B)+d_{MH}(B,C))$$K=2.0563$.
La trama no es muy esclarecedor, pero voy a incluir, según lo solicitado:
Edit 3: Los siguientes límites han sido desmentidas:
\begin{align*} 1.& d_{MH}(A,C)\leq d_{MH}(A,B)+d_{MH}(B,C)+\epsilon;\\ 2.& d_{MH}(A,C)\leq K(d_{MH}(A,B)+d_{MH}(B,C));\\ 3.& d_{MH}(A,C)\leq K\cdot\max\{d_{MH}(A,B),d_{MH}(B,C)\}. \end{align*}
Contraejemplos para 1 y 2 se pueden encontrar a continuación. Para 3, elija $A,B,C$, como en (6). Luego, dejando $\delta$ el valor de la distancia mínima de un punto en $N_{n,r}$$N$$N\in\{1,2\}$, tenemos: \begin{equation*} d(A,C)\leq\frac{n}{n+1}(n\delta+1), ~~~ d(A,B)\geq\frac{n\delta+1}{n+1},~~~ d(B,C)\geq \delta. \end{ecuación*} Por lo tanto \begin{align*} d(A,C)\leq K\cdot\max\{d(A,B),d(B,C)\} &\Leftrightarrow K\geq\frac{d(A,C)}{\max\{d(A,B),d(B,C)\}}\\ &\Leftrightarrow K\geq \frac{1+r}{1/n+\delta}\rightarrow \infty \end{align*} como $r\rightarrow 0$$n\rightarrow\infty$.