3 votos

Resultados paradójicos cuando se realiza un análisis Bayesiano. Ayuda de la necesidad de explicar los resultados

Recientemente, me encontré con un caso donde he utilizado dos métodos diferentes para realizar la estimación de parámetros, y que terminaron con resultados contradictorios. Voy a utilizar un ejemplo muy sencillo para ilustrar el problema: estimar el parámetro de una moneda. Voy a presentar dos soluciones para el mismo problema, y que parecen producir contradiciendo los resultados.

Problema: Decidir si una moneda es justo después de la observación de 2 cabezas y 3 colas.

Definición y notación: Vamos θ ser la probabilidad de sacar cara. Una moneda es justo si $θ\in(0.49, 0.51)$. En la siguiente, voy a utilizar la notación $Data$ para denotar la observación de $(H=2, T=3)$.

Asunción: Asumir un uniforme antes de $P(θ)\sim Uniform(0,1)$ o, equivalentemente, $P(θ) \sim Beta[1,1]$

Hipótesis:

  • H0: La moneda es justo, $θ\in(0.49, 0.51)$.
  • H1: La moneda no es justo, $θ\in[0, 0.49]\cup[0.51, 1]$.

Tenga en cuenta que H0 y H1 son mutuamente excluyentes y que cubren el conjunto [0, 1] rango.

Tengo dos soluciones en las que no puedo encontrar errores, pero se produjo conclusiones contradictorias.

Solución 1: análisis Bayesiano de P(θ|Datos) $$ P(θ|Datos) = \frac{P(Datos|θ) * P(θ)}{P(Datos)} = \frac{P(Datos|θ) * P(θ)}{\int_0^1 P(Datos|θ) * P(θ)\,dθ} $$

Vamos a pluging de Datos = (H=2, T=3), y P(θ)=1 para θ∈[0, 1].

Tenga en cuenta que P(Datos|θ) sigue una distribución Binomial. $$ P(Datos|θ) = θ^2 * (1-θ)^3 $$ Así: $$ P(θ|Datos) = \frac{P(Datos|θ) * P(θ)}{\int_0^1 P(Datos|θ) * P(θ)\,dθ} = \frac{q^2 * (1-θ)^3 * 1.0}{\int_0^1 θ^2 * (1-θ)^3 * 1.0\,dθ} $$ Podemos pegar la expresión anterior en wolframalpha para verificar que el anterior se simplifica a: $$ P(θ|Datos) = 60 (1 - θ)^3 θ^2 $$ También podemos comprobar que este es un buen pdf, ya que se integra a 1 en [0,1].

Ahora podemos calcular P(0.49<θ<0.51|Datos) mediante la integración de P(θ|Datos) a través de [0.49, un 0,51]: $$ \int_{0.49}^{0.51} P(θ|Datos)\,dθ = \int_{0.49}^{0.51} 60*(1 - θ)^3*θ^2\, dθ = 0.03749 $$ Por lo $P(H0|Data) = 0.03749$ $P(H1|Data) = 1 - P(H0 | Data) = 0.96251$

La conclusión es que H1 es mucho más probable que sea correcta: la moneda es probable injusto.

Solución 2: Análisis de datos probabilidad P(Datos|H0) y P(Datos|H1)

Veamos H0 primero: θ∈(0.49, 0.51). Suponiendo que H0 es verdadera, correcta normalizar el uniforme antes de la distribución da P(θ)=50 para θ∈(0.49, 0.51). $$ P(Datos|H0, θ) = θ^2 * (1-θ)^3 $$ Dejando de lado a las más de θ (computación en la expectativa sobre θ): $$ \begin{align} P(Data|H0) & \\&= \int_{0.49}^{0.51} θ^2 * (1-θ)^3 * P(θ)\, dθ \\&= \int_{0.49}^{0.51} θ^2 * (1-θ)^3 * 50 \, dθ \\&= 0.0312417 \end{align} $$ (Una manera rápida de obtener una aproximación a esta integral es simplemente calcular $P(Data|H0, θ=0.5)$, lo que da 1/32=0.03125. También se comprueba la matemática anterior).

Ahora suponemos que H1 es verdadera: θ∈[0, 0.49]∪[0.51, 1]. Suponiendo que H1 es verdadera en su lugar, correctamente normalizar el uniforme antes de la distribución da P(θ)=1/0.98 para θ∈[0, 0.49]∪[0.51, 1]. Usando exactamente el mismo razonamiento: $$ P(Datos|H1, θ) = θ^2 * (1-θ)^3 $$ Dejando de lado a las más de θ (computación en la expectativa sobre θ): $$ \begin{align} P(Data|H1)& \\&= \int_{0}^{0.49} θ^2 * (1-θ)^3 * P(θ)\, dθ + \int_{0.51}^{1} θ^2 * (1-θ)^3 * P(θ)\, dθ \\&= \int_{0}^{0.49} θ^2 * (1-θ)^3 * 1/0.98\, dθ + \int_{0.51}^{1} θ^2 * (1-θ)^3 * 1/0.98\, dθ \\&= 0.0163692 \end{align} $$ Con $P(Data|H0) = 0.0312417$$P(Data|H1) = 0.0163692$, la conclusión es que la moneda es más probable de la feria.

He comprobado mi razonamiento y matemáticas por encima tanto de la solución, y no podía detectar errores. Pero claramente producido conclusiones contradictorias. Alguien me puede ayudar a explicar? Gracias.

1voto

Luke Puntos 798

No hay ninguna paradoja.

La parte posterior de probabilidades a favor de H0 en relación a H1 es igual a la probabilidad previa de veces que el factor de Bayes. Cuando se cambia la probabilidad previa de que el cambio posterior de probabilidades.

En la "Solución 1" el estado de probabilidades a favor de H0 se 2/98 = 1/49. En "Solución de 2" las probabilidades previas son 1/1. Por lo tanto, la probabilidad final en favor de H0 de acuerdo a la "Solución 2" es 49 veces mayor que la de la parte posterior de probabilidades a favor de H0 de acuerdo a la "Solución 1": $$ \underbrace{0.0312417\div 0.0163692}_{\text{Soln 2 posterior probabilidades}} = 49 \times \underbrace{0.03749\div 0.96251}_{\text{Soln 1 posterior probabilidades}}. $$

(Por CIERTO, yo no marque ninguna de la obra. Simplemente me fui directamente a la parte posterior de los odds ratios en la teoría de que todo lo que hasta ese momento se ha realizado correctamente.)

0voto

falafa Puntos 23

De forma intuitiva:

  • Solución 2 da un buen resultado. Un resultado de 2H/3T parece plausible cuando arrojar una moneda.

  • Suponga que un experimento de 0 lanzar una moneda. Usted no será capaz de decir nada acerca de la imparcialidad de la moneda, el trasero es el mismo que el anterior: la distribución uniforme. Sin embargo, el enfoque de la 1 todavía decimos que la moneda no es justo porque usted integrar a una mucho más pequeña de la gama bajo H0.

Parece, el problema con la solución 1 es que no se toman los intervalos desiguales cubiertos por la hipótesis en cuenta. Solución 2 hace que al normalizar los priores.

Tengo que dejar por ahora. Si encuentro el momento, voy a añadir algunos de los aspectos formales más tarde.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X