7 votos

Probabilidad de colisión (dos distribuciones normales bivariadas)

Estoy tratando de resolver este problema de forma intermitente desde hace un par de meses, pero sin éxito. Se suponía que era una parte muy pequeña de mi tesis doctoral en navegación, pero supongo que subestimé el problema. Al principio parecía trivial, pero ahora no estoy tan seguro.

Digamos que tenemos dos barcos, cada uno con su propia posición nominal en coordenadas 2D (media). Debido a los errores de los sistemas de posicionamiento, sólo podemos estar seguros de que los barcos se encuentran a menos de 1 milla de la media con una probabilidad del 95% (distribución normal). Dadas estas 2 posiciones y esta distribución de probabilidad, ¿cuál es la probabilidad de que los barcos estén a menos de 5 millas el uno del otro? También, la misma pregunta si la posición probable del barco es una elipse, no un círculo.

He preguntado a algunas personas y me han dicho que no hay soluciones analíticas. Si realmente es así, por favor, expliquen cómo resolverlo numéricamente.

Como ya se puede intuir, procedo de la ingeniería, por lo que mis matemáticas están más que oxidadas.

Me disculpo de antemano si la pregunta es demasiado vaga o trivial para este foro. Estaré encantado de explicarlo con más detalle si es necesario.

He encontrado este Pero sólo es para el caso univariante, y además no sé cómo implementarlo en mi caso en el que necesito encontrar la probabilidad de que la distancia entre dos barcos sea inferior a 5 millas.

Me imagino este problema como un plano con dos colinas que se cruzan y la solución es el volumen bajo el círculo con diámetro de 5 millas que se encuentra en algún lugar entre los dos picos de colinas (medios).

¿Estoy en el camino correcto?

Gracias

6voto

jldugger Puntos 7490

Resumen

El problema no es trivial, pero la obtención de una solución es sencilla. Se pueden encontrar expresiones analíticas exactas para la distribución de la distancia entre barcos (en términos de funciones de Bessel): es la raíz cuadrada de una variante chi-cuadrado no central escalada. Siempre que los barcos estén muy separados en comparación con la desviación estándar de las estimaciones de posición, las fórmulas para la media y la varianza de esta distribución proporcionan una excelente aproximación Normal. Esto puede utilizarse para desarrollar intervalos de confianza o una distribución posterior para la distancia.


Un comentario describe los datos:

Los datos que tengo son 2 pares de coordenadas x,y que marcan las posiciones estimadas de 2 barcos. Además, los errores de posición son normales bivariados con un 95% de probabilidad de que la posición real del barco esté dentro de 1 milla de la posición esperada.

Será conveniente obtener los parámetros convencionales de los errores de posición. Una distribución normal bivariada sin correlación y con varianzas de $\sigma^2$ para cada una de las coordenadas tiene una probabilidad total de $1 - \exp(-x^2/(2\sigma^2))$ a una distancia $x$ de su media. Dejando $x$ sea una milla y poner esta expresión en $0.95$ determina $\sigma^2$ . En general, cuando la probabilidad es $1-\alpha$ ( $\alpha=0.05$ aquí) en un radio de $x$ entonces

$$\sigma^2 = \frac{x^2}{-2 \log(\alpha)}.$$

Dejemos que $(X_1,Y_1)$ sea la ubicación observada del barco 1, que se supone que está en la ubicación desconocida $(\mu_{x1}, \mu_{y1})$ y $(X_2,Y_2)$ la ubicación observada del buque 2, que se supone que está en $(\mu_{x2}, \mu_{y2})$ . Su al cuadrado distancia,

$$D^2 = (X_1 - X_2)^2 + (Y_1 - Y_2)^2,$$

es una suma de cuadrados de dos variantes normales: $X_1-X_2$ tiene una expectativa de $\mu_{x1}-\mu_{x2}$ y una varianza de $2\sigma^2 = \sigma^2 + \sigma^2$ mientras que $Y_1-Y_2$ tiene una expectativa de $\mu_{y1}-\mu_{y2}$ y una varianza de $2\sigma^2$ . Esto hace que $D^2$ igual a $2\sigma^2$ veces a no central $\chi^2$ distribución con $\nu=2$ grados de libertad y parámetro de no centralidad

$$\lambda = \frac{(\mu_{x1}-\mu_{x2})^2 + (\mu_{y1}-\mu_{y2})^2}{2\sigma^2}.$$

En consecuencia, $D$ podría llamarse "no central" (a escala) $\chi$ distribución".

Los cálculos indican que la media de $D$ es igual a $\sqrt{2}\sigma$ veces $$\frac{1}{2} e^{-\lambda /4} \sqrt{\frac{\pi }{2}} \left((2+\lambda ) \text{BesselI}\left[0,\frac{\lambda }{4}\right]+\lambda \text{BesselI}\left[1,\frac{\lambda }{4}\right]\right)$$ y (algo sorprendente) su segundo momento bruto es $2\sigma^2$ veces $2+\lambda$ . Como era de esperar, la media (curva azul superior) se acerca a $\sqrt{\lambda}$ (curva roja inferior), especialmente para los grandes $\lambda$ que se produce cuando las naves están bien separadas:

Plot of mean versus lambda

A partir de ellas, por coincidencia de momentos, obtenemos una aproximación Normal a $D$ . Es notablemente bueno cuando los barcos están separados por varios $\sigma$ 's. (La aproximación Normal tiene colas ligeramente más cortas.) Por ejemplo, aquí están los gráficos de la distribución de $D$ y su aproximación Normal cuando las dos naves están realmente $5$ kilómetros de distancia en las circunstancias de la cita inicial:

PDF plot and its approximation

En esta resolución, coinciden perfectamente. La probabilidad correcta de que $D$ es menor que $5$ , $\Pr(D\le 5)$ es igual a $0.476912$ mientras que la probabilidad dada por la aproximación Normal es $0.476807$ : solo $0.0001$ fuera.

Sin embargo, estos cálculos no responden directamente a la pregunta, que es: dado el valor observado de $D$ ¿Qué podemos decir de la verdadero distancia entre los barcos (igual a $\delta = \sqrt{(\mu_{x1}-\mu_{x2})^2 + (\mu_{y1}-\mu_{y2})^2}$ )? Esto suele tener dos tipos de respuestas:

  1. Para cualquier nivel de confianza deseado, podemos calcular un intervalo de confianza para $\delta$ o

  2. Si adoptamos una distribución a priori para $\delta$ podemos actualizar esa distribución (mediante el Teorema de Bayes) en función de $D$ para obtener una distribución posterior.

Cualquiera de los dos métodos es fácil y sencillo cuando la aproximación Normal a la distribución de $D$ es bueno. De lo contrario, ambos requieren una gran cantidad de cálculos, pero eso es una discusión para otro día.

2voto

Jasmine D Puntos 1

No estoy seguro de que esto te ayude, pero espero que te dé algunas pistas.

Aquí hay una función de Mathematica que calcula la probabilidad bajo las distribuciones para un círculo de radio de separación/2 para dos barcos con una distribución normal de posición con varianza 0,2. Una varianza de 0,2 se acerca al nivel de certeza del 95%.

En resumen, define una distribución de mezcla en 2 dimensiones con matriz de covarianza {{0,2,0},{0,0,2}} (*otras matrices de covarianza explicarían las distribuciones elípticas*). Forma la función de distribución de probabilidad para esa mezcla y luego la integra numéricamente sobre el rango requerido.

(* Utiliza la distancia de separación absoluta girada hacia el eje x *)

probProximity[reportedSeparationMiles_, probabiityRangeMiles_] := 
 With[{dist = MixtureDistribution[{1, 1},
 {MultinormalDistribution[{-(reportedSeparationMiles/2),0}, {{0.2, 0}, {0,0.2}}], 
  MultinormalDistribution[{  reportedSeparationMiles/2, 0}, {{0.2, 0}, {0,0.2}}]}]}, 
  NIntegrate[
   PDF[dist][{x, y}] 
   Boole[Abs[\[Sqrt]((0 - x)^2 + (0 - y)^2)] <= probabiityRangeMiles/2], 
   {x, -(probabiityRangeMiles/2), probabiityRangeMiles/2}, 
   {y, -(probabiityRangeMiles/2), probabiityRangeMiles/2}]]

La distribución de probabilidad de la posición de dos barcos a 5 millas de distancia con un 95% de confianza de estar dentro de una milla de la posición reportada.

Separation Distribution

Para un rango de 5 millas, el valor calculado es

probProximity[5, 5]

0.464173

Aquí está la probabilidad de proximidad en un rango de distancias: Probability of separation

1voto

bitbonk Puntos 222

He lanzado una simulación con R con dimensión creciente en respuesta a la respuesta de Erik. Este código también responde a la pregunta, proporcionando una solución numérica (cuando se fija la dimensión a 2) a un caso especial que puede ser fácilmente generalizado (aunque no es muy eficiente).

Erik propuso considerar el problema como un problema unidimensional eligiendo un sistema de coordenadas, que se encuentra en las líneas que conectan los dos barcos. Esto no puede funcionar, ya que al aumentar la dimensión, la probabilidad de estar cerca disminuye.

Estoy tomando muestras de dos $d$ -gaussianos con medias $(1,0,\dots)$ y $(0,0,\dots)$ . La covarianza es la matriz de identidad. El código traza la frecuencia de los puntos que están a menos de 1 de distancia (distancia euclidiana) y utiliza 1000 muestras para cada dimensión.

Usando la simulación se pueden modelar fácilmente las elipses simplemente ajustando la matriz de covarianza (lo que mi código no permite, ya que no uso una biblioteca para el muestreo de gaussianos).

require(ggplot2)

euc.dist <- function(x1,x2) {
        d = length(x1)
        sqrt(sum((x1-x2) ^ 2))
}
drawDist <- function(d) {
        v1 <- replicate(d,rnorm(1))
        v2 <- replicate(d,rnorm(1))
        #resample the first component of v1 to get 1,0,0,...
        v1[1] <- rnorm(1,1)
        euc.dist(v1,v2)
}
png("hit-prob.png")
qplot(1:10,
      sapply(1:10,function(d) 
           mean(replicate(1000,drawDist(d) < 1))), #This is the important line
      xlab="dimension",ylab="Hit Freq")
dev.off()

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X