20 votos

Cómo aplicar el teorema de Bayes a la búsqueda de un pescador perdido en el mar

El artículo Las probabilidades, continuamente actualizadas menciona la historia de un pescador de Long Island que literalmente debe su vida a las estadísticas bayesianas. Aquí está la versión corta:

Hay dos pescadores en un barco en medio de la noche. Mientras que uno es dormido, el otro cae en el océano. El barco sigue trolando en piloto automático durante toda la noche hasta que el primer tipo finalmente se despierta y notifica a la Guardia Costera. La Guardia Costera usa una pieza de un software llamado SAROPS (Planificación óptima de búsqueda y rescate Sistema) para encontrarlo justo a tiempo, ya que estaba hipotérmico y casi sin energía para mantenerse a flote.

Aquí está la versión larga: Una mancha en el mar

Quería saber más sobre cómo el Teorema de Bayes se aplica realmente aquí. Descubrí bastante sobre el software de SAROPS con sólo buscar en Google.

El simulador de SAROPS

El componente del simulador tiene en cuenta datos oportunos como las corrientes oceánicas, el viento, etc. y simula miles de posibles trayectorias de deriva. A partir de esas trayectorias de deriva, se crea un mapa de distribución de probabilidad.

_Tenga en cuenta que los siguientes gráficos no se refieren al caso del pescador desaparecido que mencioné anteriormente, sino que son un ejemplo de juguete tomado de esta presentación_

Mapa de probabilidad 1 (El rojo indica la probabilidad más alta; el azul la más baja) enter image description here

Fíjate en el círculo que es el punto de partida.

Mapa de probabilidad 2 - Ha pasado más tiempo enter image description here

Obsérvese que el mapa de probabilidad se ha convertido en multimodal. Esto se debe a que en este ejemplo, se tienen en cuenta múltiples escenarios:

  1. La persona está flotando en el agua - modo superior-medio
  2. La persona está en una balsa salvavidas (más afectada por el viento del Norte) - 2 modos de fondo (dividido debido a los "efectos del foque")

Mapa de probabilidad 3 - La búsqueda se ha realizado a lo largo de los caminos rectangulares en rojo enter image description here Esta imagen muestra los caminos óptimos producidos por el planificador (otro componente de SAROPS). Como pueden ver, esos caminos fueron buscados y el mapa de probabilidad ha sido actualizado por el simulador.

Tal vez se pregunte por qué las áreas que se han buscado no se han reducido a una probabilidad cero. Eso es porque hay una probabilidad de fracaso, $p( \text {fail})$ y si se tiene en cuenta que hay una posibilidad nada despreciable de que el buscador pase por alto a la persona que está en el agua Es comprensible que la probabilidad de fracaso sea mucho mayor para una persona sola a flote que para una persona en una balsa salvavidas (más fácil de ver), por lo que las probabilidades en la zona superior no bajaron mucho.

Efectos de una búsqueda infructuosa

Aquí es donde el Teorema de Bayes entra en juego. Una vez que se realiza una búsqueda, el mapa de probabilidad se actualiza en consecuencia para que otra búsqueda pueda ser planificada de manera óptima.

Después de revisar el Teorema de Bayes en wikipedia y en el artículo Una intuitiva (y corta) explicación del teorema de Bayes en Mejor Explicado.com

Tomé la ecuación de Bayes:

$$ P( \text {A} \mid\text {X}) = \frac {P( \text {X} \mid\text {A}) \times P( \text {A})}{P( \text {X})} $$

Y definió a A y X de la siguiente manera...

  • Evento A: La persona está en esta área (célula de la cuadrícula)

  • Prueba X: Búsqueda infructuosa en esa área (celda de la cuadrícula), es decir, buscó en esa área y no vio nada.

Cediendo,

$$ P( \text {person there} \mid\text {unsuccessful}) = \frac {P( \text {unsuccessful} \mid\text {person there}) \times P( \text {person there})}{P( \text {unsuccessful})} $$

Encontré en Sistema de Planificación Óptima de Búsqueda y Rescate que SAROPS calcula la probabilidad de una búsqueda fallida, $P( \text {fail})$ teniendo en cuenta las rutas de búsqueda y las rutas de deriva simuladas. Así que para simplificar, asumamos que sabemos cuál es el valor de $P( \text {fail})$ es.

Así que ahora lo hemos hecho,

$$ P( \text {person there} \mid\text {unsuccessful}) = \frac {P( \text {fail}) \times P( \text {person there})}{P( \text {unsuccessful})} $$

  1. ¿Se aplica correctamente la ecuación de Bayes aquí?

  2. ¿Cómo se calcularía el denominador, la probabilidad de una búsqueda infructuosa?

    También en Sistema de Planificación Óptima de Búsqueda y Rescate dicen

    Las probabilidades previas son "normalizado en la forma habitual Bayesiana" para producir las probabilidades posteriores

  3. ¿Qué es lo que "normalizado en la forma normal Bayesiana" ¿maldito?

    ¿Significa que todas las probabilidades se dividen por $P( \text {unsuccessful})$ o simplemente normalizado para asegurar que todo el mapa de probabilidad suma uno? O, ¿son estos uno y lo mismo?

  4. Por último, ¿cuál sería la forma correcta de normalizar el mapa de probabilidades de la cuadrícula después de haber actualizado para una búsqueda infructuosa, considerando que como no ha buscado en TODAS las áreas (celdas de la cuadrícula) tendría algunas celdas iguales a $P( \text {person there})$ y algunos iguales a $P( \text {person there} \mid\text {unsuccessful})$ ?

Otra nota de simplificación, según Sistema de Planificación Óptima de Búsqueda y Rescate la distribución posterior se calcula realmente actualizando las probabilidades de las trayectorias de deriva simuladas, y luego volviendo a generar el mapa de probabilidad cuadriculado. Para mantener este ejemplo lo suficientemente simple, elegí ignorar las trayectorias simuladas y centrarme en las celdas de la cuadrícula.

6voto

jaradniemi Puntos 1535
  1. Asumiendo la independencia entre las celdas de la cuadrícula, entonces sí parece que el Teorema de Bayes se ha aplicado correctamente.
  2. El denominador se puede ampliar, por ejemplo $$P(X) = P(X|A)P(A) + P(X|A^c)P(A^c)$$ utilizando el ley total de probabilidad donde $A^c$ es el complemento de $A$ Es decir, la persona no está allí. Lo más probable es que usted asuma $P(X|A^c)=1$ .
  3. No estoy muy seguro de lo que significa "normalizado al modo bayesiano normal", ya que no he escrito el manual. Pero seguro que se refieren a que las siguientes tres ecuaciones son suficientes para encontrar $P(A|X)$ : $$P(A|X) \propto P(X|A)P(A)\quad P(A^c|X), \propto P(X|A^c)P(A^c), \mbox{ and } P(A|X)+P(A^c|X) = 1$$ Así que nunca tendrás que calcular $P(X)$ es decir, la constante de normalización. No sé si lo utilizaron para actualizar la probabilidad de una sola celda de la cuadrícula o de todo el mapa (probablemente ambas cosas).
  4. Ampliemos la notación para tener la celda de la cuadrícula $i$ y $A_i$ sea el caso de que el individuo esté en la celda de la red $i$ y $X_i$ sea el caso de que la celda de la red $i$ fue registrado y no se encontró a nadie. Con la nueva anotación, $X$ va a ser la colección de búsquedas que fallaron. Suponemos lo siguiente:

    • $\sum_i P(A_i|X)=1$ , es decir, después de realizar las búsquedas, la suma global de las celdas de la probabilidad de que el individuo esté en esa celda es 1. Esta es la ley total de la probabilidad de nuevo.
    • Si asumimos que la búsqueda en una celda no nos dice nada sobre ninguna otra celda, entonces para las celdas que fueron buscadas $P(A_i|X) = P(A_i|X_i)\propto P(X_i|A_i)P(A_i)$ y para las células que no fueron buscadas $P(A_i|X) \propto P(A_i)$ . Si no asumimos la independencia, las fórmulas serán más complicadas pero la intuición será similar, es decir, calcular $P(A_i|X)$ hasta una constante de proporcionalidad.

    Podemos utilizar estos dos supuestos para calcular $P(A_i|X)$ y actualizar el mapa en consecuencia.

0 votos

Gracias por las excelentes respuestas ;) Así que, asumiendo la independencia de las celdas de la red y $\sum_{i}P(A_i|X)=1$ después de buscar en cada celda una vez sería válido calcular $P(X|A)P(A)$ para cada celda y luego dividir cada celda por la suma de todas las celdas ( $\sum_{i}P(X|A)P(A_i)$ ) para normalizar?

0 votos

Me acabo de dar cuenta de que buscar cada celda con una probabilidad de fallo fija no supondría ningún cambio entre la distribución de probabilidad :)

0 votos

Para decirlo de otra manera... Asumiendo la ley de la probabilidad total (como en tu respuesta a 4.), después de que algunas (pero no todas) de las celdas fueran buscadas, ¿podríamos normalizar dividiendo cada celda por la suma de todas las celdas? ...usando $P(X|A)P(A_i)$ para el valor de las celdas que se han buscado y $P(A_i)$ para los que no lo han hecho.

5voto

Naoko Puntos 21

Me señalaron un libro que tiene un capítulo entero dedicado a mi pregunta - Análisis de operaciones navales - por un antiguo profesor que fue piloto de helicóptero y que ha realizado misiones de búsqueda y rescate, ¡nada menos!

En el capítulo 8 se ofrece un ejemplo parecido a este (lo he personalizado un poco):

Para empezar, hay una distribución previa cuadriculada para la localización de la(s) persona(s) desaparecida(s), el barco, etc.

Distribución previa: Prior distribution

Se realiza una búsqueda en una parte de la cuadrícula y las probabilidades se actualizan con un distribución posterior normalizada aplicando la ecuación de Bayes de la misma manera que mencioné en mis preguntas:

$$ P(\text{target in (i,j)}\mid\text{no detection}) = \frac{P(\text{no detection}\mid\text{target in (i,j)}) \times P(\text{target in (i,j)})}{P(\text{no detection})} $$

donde (i,j) = (lat,long)

En este caso, decidí buscar en la columna 3 porque esa columna tenía el mayor total antes probabilidad.

Distribución posterior normalizada después de buscar la tercera columna con pFail = 0,2: Normalized posterior distribution (w/ failure probability = 0.2)

Mi pregunta se refería principalmente a cómo se normalizó la parte posterior. Así es como se hizo en el libro - simplemente dividir cada probabilidad posterior individual por la suma total , S :

Image description

Elegí una probabilidad de 0,2 de una búsqueda fallida porque mi profesor dijo esto, "Sólo buscamos hasta el 80% de probabilidad de detección porque ese suele ser el mejor compromiso entre rapidez y precisión".

Por si acaso, he ejecutado otro ejemplo con un pFail de 0,5. Mientras que en el primer ejemplo ( pFail \= 0,2), la siguiente mejor ruta de búsqueda (dada la posterior normalizada y suponiendo búsquedas en línea recta, sin diagonal ni zig-zag) sería sobrevolar la columna 2, en el segundo ejemplo ( pFail \= 0,5) la siguiente mejor ruta es sobre fila 2.

Distribución posterior normalizada después de buscar la tercera columna con pFail = 0,5: eNormalized posterior distribution (w/ failure probability = 0.5)

enter image description here

También añadió esto, "Los aviones llevan consigo una pequeña lista de comprobación para ayudar a determinar la mejor altitud y velocidad del aire. Trabajar con esto en un helicóptero en vuelo es como estar sentado encima de una lavadora, leyendo un libro que está pegado a otra lavadora".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X