Resumen
El problema no es trivial, pero la obtención de una solución es sencilla. Se pueden encontrar expresiones analíticas exactas para la distribución de la distancia entre barcos (en términos de funciones de Bessel): es la raíz cuadrada de una variante chi-cuadrado no central escalada. Siempre que los barcos estén muy separados en comparación con la desviación estándar de las estimaciones de posición, las fórmulas para la media y la varianza de esta distribución proporcionan una excelente aproximación Normal. Esto puede utilizarse para desarrollar intervalos de confianza o una distribución posterior para la distancia.
Un comentario describe los datos:
Los datos que tengo son 2 pares de coordenadas x,y que marcan las posiciones estimadas de 2 barcos. Además, los errores de posición son normales bivariados con un 95% de probabilidad de que la posición real del barco esté dentro de 1 milla de la posición esperada.
Será conveniente obtener los parámetros convencionales de los errores de posición. Una distribución normal bivariada sin correlación y con varianzas de $\sigma^2$ para cada una de las coordenadas tiene una probabilidad total de $1 - \exp(-x^2/(2\sigma^2))$ a una distancia $x$ de su media. Dejando $x$ sea una milla y poner esta expresión en $0.95$ determina $\sigma^2$ . En general, cuando la probabilidad es $1-\alpha$ ( $\alpha=0.05$ aquí) en un radio de $x$ entonces
$$\sigma^2 = \frac{x^2}{-2 \log(\alpha)}.$$
Dejemos que $(X_1,Y_1)$ sea la ubicación observada del barco 1, que se supone que está en la ubicación desconocida $(\mu_{x1}, \mu_{y1})$ y $(X_2,Y_2)$ la ubicación observada del buque 2, que se supone que está en $(\mu_{x2}, \mu_{y2})$ . Su al cuadrado distancia,
$$D^2 = (X_1 - X_2)^2 + (Y_1 - Y_2)^2,$$
es una suma de cuadrados de dos variantes normales: $X_1-X_2$ tiene una expectativa de $\mu_{x1}-\mu_{x2}$ y una varianza de $2\sigma^2 = \sigma^2 + \sigma^2$ mientras que $Y_1-Y_2$ tiene una expectativa de $\mu_{y1}-\mu_{y2}$ y una varianza de $2\sigma^2$ . Esto hace que $D^2$ igual a $2\sigma^2$ veces a no central $\chi^2$ distribución con $\nu=2$ grados de libertad y parámetro de no centralidad
$$\lambda = \frac{(\mu_{x1}-\mu_{x2})^2 + (\mu_{y1}-\mu_{y2})^2}{2\sigma^2}.$$
En consecuencia, $D$ podría llamarse "no central" (a escala) $\chi$ distribución".
Los cálculos indican que la media de $D$ es igual a $\sqrt{2}\sigma$ veces $$\frac{1}{2} e^{-\lambda /4} \sqrt{\frac{\pi }{2}} \left((2+\lambda ) \text{BesselI}\left[0,\frac{\lambda }{4}\right]+\lambda \text{BesselI}\left[1,\frac{\lambda }{4}\right]\right)$$ y (algo sorprendente) su segundo momento bruto es $2\sigma^2$ veces $2+\lambda$ . Como era de esperar, la media (curva azul superior) se acerca a $\sqrt{\lambda}$ (curva roja inferior), especialmente para los grandes $\lambda$ que se produce cuando las naves están bien separadas:
A partir de ellas, por coincidencia de momentos, obtenemos una aproximación Normal a $D$ . Es notablemente bueno cuando los barcos están separados por varios $\sigma$ 's. (La aproximación Normal tiene colas ligeramente más cortas.) Por ejemplo, aquí están los gráficos de la distribución de $D$ y su aproximación Normal cuando las dos naves están realmente $5$ kilómetros de distancia en las circunstancias de la cita inicial:
En esta resolución, coinciden perfectamente. La probabilidad correcta de que $D$ es menor que $5$ , $\Pr(D\le 5)$ es igual a $0.476912$ mientras que la probabilidad dada por la aproximación Normal es $0.476807$ : solo $0.0001$ fuera.
Sin embargo, estos cálculos no responden directamente a la pregunta, que es: dado el valor observado de $D$ ¿Qué podemos decir de la verdadero distancia entre los barcos (igual a $\delta = \sqrt{(\mu_{x1}-\mu_{x2})^2 + (\mu_{y1}-\mu_{y2})^2}$ )? Esto suele tener dos tipos de respuestas:
-
Para cualquier nivel de confianza deseado, podemos calcular un intervalo de confianza para $\delta$ o
-
Si adoptamos una distribución a priori para $\delta$ podemos actualizar esa distribución (mediante el Teorema de Bayes) en función de $D$ para obtener una distribución posterior.
Cualquiera de los dos métodos es fácil y sencillo cuando la aproximación Normal a la distribución de $D$ es bueno. De lo contrario, ambos requieren una gran cantidad de cálculos, pero eso es una discusión para otro día.