10 votos

¿Es esta una forma correcta de actualizar continuamente una probabilidad utilizando el teorema de Bayes?

Digamos que yo estoy tratando de averiguar la probabilidad de que alguien del sabor de helado favorito es el de vainilla.

Sé que la persona también disfruta de las películas de terror.

Quiero averiguar la probabilidad de que la persona de helado favorito es el de vainilla, dado que ellos también disfruten de las películas de terror.

Que yo sepa las siguientes cosas:

  1. $5\%$ de la gente elige la vainilla, como su sabor favorito de helado. ( Este es mi $P(A)$ )
  2. $10\%$ de las personas cuyo favorito es el helado de vainilla también amo las películas de terror. ( Este es mi $P(B|A)$ )
  3. $1\%$ de las personas cuya favorito no es el helado de vainilla también amo las películas de terror ( Este es mi $P(B|\lnot A)$ )

Así que, tengo que calcular así: $$P(A|B)=\frac{0.05\times0.1}{(0.05 \times 0.1)+(0.01 \times(1-0.05))}$$ Me parece que $P(A|B) = 0.3448$ (redondeado a la decena más cercana milésima). Hay un $34.48\%$ de probabilidad de que una película de terror del ventilador sabor de helado favorito es el de vainilla.

Pero luego me entero de que la persona que ha visto una película de terror en los últimos 30 días. Aquí es lo que yo sé:

  1. $34.48\%$ es la actualización de la probabilidad posterior de que la vainilla es la persona del sabor de helado favorito -- el $P(A)$ en el siguiente problema.
  2. $20\%$ de las personas cuyo favorito es el helado de vainilla de haber visto una película de terror en los últimos 30 días.
  3. $5\%$ de las personas cuya favorito no es el helado de vainilla haber visto una película de terror en los últimos 30 días.

Esto nos da: $$\frac{0.3448\times0.2}{(0.3448\times0.2)+(0.05\times(1-0.3448))} = 0.6779$$ cuando redondeado.

Así que ahora creo que hay un $67.79\%$ de probabilidad de que la película de terror de los fans de ama de helado, dado que no he visto una película de terror en los últimos 30 días.

Pero espera, hay otra cosa. También me enteré de que la persona es titular de un gato.

Aquí es lo que yo sé:

  1. $67.79\%$ es la actualización de la probabilidad posterior de que la vainilla es la persona del sabor de helado favorito -- el $P(A)$ en el siguiente problema
  2. $40\%$ de las personas cuyo favorito es el helado de vainilla también propio de los gatos
  3. $10\%$ de las personas cuya favorito no es el helado de vainilla también propio de los gatos

Esto nos da: $$\frac{0.6779\times0.4}{(0.6779\times 0.4)+(0.1\times(1-0.6779))} = 0.8938$$ cuando redondeado.

Mi pregunta básicamente se reduce a esto: Estoy correctamente la actualización de probabilidad utilizando el teorema de Bayes? Me estoy haciendo nada malo en mis métodos?

7voto

Jonathan Christensen Puntos 2388

Esto es no correcto. Secuencial actualización de este tipo sólo funciona cuando la información que está recibiendo de forma secuencial es independiente (por ejemplo, iid observaciones de una variable aleatoria). Si cada observación no es independiente, como en este caso, es necesario considerar la distribución de probabilidad conjunta. La manera correcta de actualizar sería regresar a la anterior, encuentre la probabilidad conjunta de que alguien que ama las películas de terror, ha visto una película de terror en los últimos 30 días, y es dueño de un gato, dado que no hacer o de no elegir la vainilla, como su sabor de helado favorito y, a continuación, actualizar en un solo paso.

La actualización de forma secuencial como este, cuando los datos no son independientes rápidamente de la unidad de su probabilidad posterior mucho más altos o más bajos de lo que deberían ser.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X