9 votos

Aritmética para la actualización de probabilidades utilizando el teorema de Bayes

Esto puede ser una elemental pregunta cual es la razón por la que no he sido capaz de encontrarlo en Stackexchange o Mathoverflow sin embargo estoy teniendo problemas con la aritmética involucrados en la actualización de las probabilidades utilizando el teorema de Bayes para un problema en el que estoy trabajando.

Antecedentes:

Estoy intentando darle probabilidad de previsión de eventos futuros que no tienen o tienen pocos precedentes. A diferencia de la mayoría de la literatura y de los textos de Bayes que utilizar previamente conocidas las distribuciones de probabilidades de dar en el futuro eventos dentro de parámetros similares - mi situación es fundado en la opinión de expertos sólo con pocos o ningún razonable que las distribuciones de referencia.

Ejemplo:

GM anunció que está desarrollando un nuevo coche, pero no dijo cuando iba a ser liberada. Gerente de Producción de KIA necesita saber cuando estará listo para liberarlo para que puedan liberar su nuevo coche, aproximadamente a la misma hora.

KIA sabe que el nuevo coche tiene los siguientes componentes con el fin de estar listo para el lanzamiento (1) del motor, (2) la transmisión, (3) cuerpo (4) Ruedas y Suspensión. KIA experimentado de ingenieros del estado que para un nuevo proyecto como este son 90% seguro de que se puede completar en dos años. KIA también descubrió que el GM hizo una prueba con la nueva transmisión en otro SUV y funcionó como se ha diseñado con un 95% de tasa de éxito. Los mismos ingenieros declaró que, en esta prueba de la transmisión de un coche puede ser completado dentro de ese marco de tiempo de un 70% del tiempo.

La manera que tengo de ella, en este punto KIA puede iniciar el cálculo Bayesiano con la inicial de la muestra de la siguiente manera:

   A = GM will release the new car in two years
   B1 = GM will successfully test a new transmission
   P(A) = Prior Probability that GM will release the new car in two years
   P(B1) = Probability that GM will successfully test a new transmission
   P(B1|A) = Likelihood that given a successful transmission test, the car will be released within 2 years

La asignación de valores de la siguiente manera

   P(A) = .9
   P(B1) = .95
   P(B1|A) = .7

$$ P(A|B_1) = \frac {P(a)P(B_1|A)}{P(a)P(B_1|A)+P(\bar{A})P(B_1|\bar{A})} $$

$$ .9545 = \frac {.9*.7}{(.9*.7)+(.1*.3)} $$

Poco después de que el KIA departamento de estadísticas dio a esta actualización, GM anunció que habían probado su nuevo motor y tenía un 98% de tasa de éxito en todas sus pruebas. El KIA ingenieros dijo que normalmente si no es un éxito de la prueba de motor que hay un 80% de probabilidades de que un coche se completará en el tiempo -, pero que no sabe cuál es la probabilidad en el conjunto de la hora de finalización fue dado a ambos y en el motor y una transmisión de prueba fue.

Los valores ahora para nuestro segundo bits de datos, para lo cual deben tenerse en cuenta son independientes para este caso - pero no en todos los casos, por ejemplo, el cuerpo debe ir después de la suspensión:

   P(B2) = .98
   P(B2|A) = .8

Así que aquí es donde yo estoy teniendo problemas: aritméticamente la integración de la parte posterior P(A|B1) en el cálculo de P(a|B1,B2), dado que los priores debe permanecer constante. Como ya he mencionado, algunos eventos dentro de {$B_1...B_n$} son independientes, otros son condicionales.

He visto la entrada de la wikipedia, que describe tres eventos de bayes extensión:

$$ P(A|B_1,B_2) = \frac {P(B_2|A,B_1)P(B_1|a)P(A)}{P(B_2|B_1)P(B_1)} $$

sin embargo ¿qué pasa con un cuarto y quinto extensión?

La mayoría de los libros y recursos en línea que tengo no muestran los pasos para la actualización de los priores de alguna manera que yo pueda discriminar. Podría ser que estoy demasiado lejos de mi pregrado cálculo de los días de interpretar, pero mi temor es que necesito tener una experiencia importante en la teoría de conjuntos y el nivel de posgrado de matemáticas con el fin de hacer de lo que parece ser un simple cálculo. Este cambio es el más cercano que pude encontrar y aunque no paso a través de ella. El hecho de que no he después de una semana de búsqueda encontró un básico tutorial sobre la mecánica de actualizar el teorema de Bayes (no mente acerca de lo que el teorema de Bayes es y cómo funciona - no hay más que suficientes) más allá de la primera aplicación, me hace pensar que no es un trivial de cálculo. Hay una manera sencilla de hacer esto sin actualizar el nivel de posgrado de la matemática?

Nota: soy consciente de la ironía relacionados con la dificultad inherente de la actualización "problema" WRT Bayes como Yudkowski ha pasado sobre ella por algún tiempo. Yo estaba asumiendo, tal vez erróneamente, que los que trabajan en ella no fueron referencia mucho más complejo de iteraciones, sin embargo soy consciente de que podría ser el caso de que estoy ejecutando en ese tema.

12voto

mdahlman Puntos 5700

Voy a empezar por responder a su pregunta acerca de los eventos de actualización con el "cuarto y quinto extensiones." Como se sospechaba, la media aritmética es de hecho bastante simple.

En primer lugar, recordemos cómo el teorema de Bayes, se deriva de la definición de probabilidad condicional:

enter image description here

Por el condicionamiento de a en el numerador, podemos llegar a la más conocida de la forma:

enter image description here

Ahora, considere si no nos acaba de B, pero en lugar de 2 o más eventos B_1, B_2... Para que se derivan de los tres eventos de Bayes extensión que citar el uso de la regla de la cadena de probabilidad, que es (de wikipedia):

enter image description here

Para B_1 y B_2, partimos de la definición de probabilidad condicional

enter image description here

Y el uso de la regla de la cadena en el numerador y el denominador:

enter image description here

Y al igual que hemos volvió a deducir la ecuación de la cita de la wikipedia. Vamos a tratar de agregar otro evento:

enter image description here

enter image description here

La adición de un quinto evento es igualmente simple (ejercicio para el lector). Pero usted seguramente va a notar un patrón, es decir, que la respuesta a los tres eventos de la versión se celebra dentro de la respuesta a las cuatro-sucesos versión, por lo que podemos reescribir esto como:

enter image description here

enter image description here

O, más en general, la regla para la actualización de la parte posterior después de la enésima parte de la evidencia:

enter image description here

La fracción no es lo que usted está interesado en. Ahora, lo que estamos hablando es de que esto podría no ser fácil de calcular - no porque la aritmética dificultad, pero debido a las dependencias dentro de la B. Si decimos que cada B es independiente distribuido, la actualización se hace muy sencilla:

enter image description here

(De hecho, te darás cuenta de que es una simple aplicación del teorema de Bayes!) La complejidad de la fracción depende de los anteriores elementos de prueba de su nueva pieza de evidencia depende. La importancia de la condicional de la dependencia entre las variables y sus piezas de evidencia es precisamente por eso que las redes Bayesianas se desarrollaron (de hecho, el anterior describe de la factorización de las redes Bayesianas).

Ahora, vamos a hablar acerca de su ejemplo. En primer lugar, su interpretación de la palabra problema, tiene un problema. Su interpretación de un 70% y 80%, respectivamente,

P(B1|A) = .7
P(B2|A) = .8

Pero (por sus definiciones) significa que el coche será completado en el tiempo, B_1 significa GM pruebas de la transmisión con éxito, y B_2 significa que hay una exitosa prueba del motor, lo que significa que está recibiendo de ellos hacia atrás - que debe ser

P(A|B1) = .7
P(A|B2) = .8

Ahora, sin embargo, el problema en realidad no tiene sentido. Aquí están las tres problemas:

1)Que efectivamente está dando lo que estás buscando: diciendo: "dada esta la prueba de la transmisión de un coche puede ser completado dentro de ese marco de tiempo de un 70% del tiempo", y luego preguntar "¿cuál es la probabilidad que un coche va a ser completados en el tiempo".

2) La evidencia de lo empuja en la dirección opuesta a la que el sentido común sería de esperar. La probabilidad era del 90% antes de que sabía acerca de la transmisión, ¿cómo puede saber acerca de un éxito de prueba inferior a 70%?

3) Hay una diferencia entre un "95% de tasa de éxito" y un 95% de probabilidad de que una prueba fue exitosa. La tasa de éxito puede significar un montón de cosas (por ejemplo, qué proporción de una parte no se rompa), lo que hace que un ingeniería de la pregunta sobre la calidad de parte, no de una evaluación subjetiva de "¿qué seguridad tenemos de la prueba logrado?" Como un ejemplo ilustrativo, imaginar que estábamos hablando de una pieza crítica de una nave espacial, que necesita al menos un 99.999% de probabilidad de trabajar durante un vuelo. Diciendo: "La pieza rompe el 20% del tiempo" no significa que hay un 80% de probabilidad de que la prueba tuvo éxito, y por lo tanto un 80% de posibilidades de que usted puede lanzar el cohete de la próxima semana. Tal vez la parte tomará 20 años para desarrollar y fijar - no hay ninguna manera de saber basado en la información que te dan.

Por estas razones, el problema está muy mal redactado. Pero, como he indicado anteriormente, la aritmética involucrados en la actualización de base en varios eventos es bastante sencillo. En ese sentido, espero haber respondido a tu pregunta.

ETA: en Base a tus comentarios, yo diría que usted debe reelaborar la cuestión de la tierra para arriba. Usted debe deshacerse de la idea de que el 95%/98% "tasa de éxito", que en este contexto es una ingeniería pregunta y no una estadística Bayesiana. En segundo lugar, las estimaciones de "Somos un 70% de confianza, dado que esta parte no funciona, que el coche estará listo en dos años" es una probabilidad posterior, no una pieza de evidencia; no se puede utilizar para actualizar lo que ya tiene.

En la situación que describes, tiene todos los cuatro piezas de trabajo en el plazo establecido. Por lo tanto, la cosa más inteligente que hacer es simplemente para decir "¿Cuál es la probabilidad de que cada parte va a trabajar en dos años?" Luego de tomar el producto de las probabilidades (suponiendo independencia), y tiene la probabilidad de toda la cosa va a estar trabajando en dos años.

Dar un paso atrás, suena como usted está realmente tratando de combinar múltiples subjetiva predicciones en uno. En ese caso, mi recomendación sería la de fuego de sus ingenieros. Por qué? Porque les están diciendo que son el 90% seguros de que estará listo en dos años, pero luego, después de aprender de una prueba del éxito de la transmisión, la rebaja de sus previsiones a 70%. Si ese es el talento que estamos trabajando, no la estadística Bayesiana se nos va a ayudar :-)

Más en serio - tal vez si fueras más específico sobre el tipo de problema (que es, probablemente, algo así como la combinación de P(A|B1) y P(A|B2)), me podrían dar algunos consejos.

0voto

guest Puntos 1851

Hay un montón de maneras de extender este resultado. La forma general es que $$P(A|B,C,D...)=\frac{P(A,B,C,D...)}{P(B,C,D,...)}$$ Hay muchas maneras de escribir tanto en el numerador y el denominador. Su formualae dar dos ejemplos (asumiendo $B_2$ $C$ son la misma cosa). Por supuesto, para un determinado problema, usted tiene que formular la LHS por escrito de los RHS en términos de cantidades realmente sabes; si que se puede hacer para su problema en particular es probablemente vale la pena una más pregunta específica, en este sitio.

Cuando las variables ($A,B,C,D$) etc son continuos, cálculo de la parte posterior en efecto, obtener mucho más complicada, en la mayoría de los problemas, y el nivel de posgrado de matemáticas/stat técnicas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X