Recientemente, me encontré con un caso donde he utilizado dos métodos diferentes para realizar la estimación de parámetros, y que terminaron con resultados contradictorios. Voy a utilizar un ejemplo muy sencillo para ilustrar el problema: estimar el parámetro de una moneda. Voy a presentar dos soluciones para el mismo problema, y que parecen producir contradiciendo los resultados.
Problema: Decidir si una moneda es justo después de la observación de 2 cabezas y 3 colas.
Definición y notación: Vamos θ ser la probabilidad de sacar cara. Una moneda es justo si $θ\in(0.49, 0.51)$. En la siguiente, voy a utilizar la notación $Data$ para denotar la observación de $(H=2, T=3)$.
Asunción: Asumir un uniforme antes de $P(θ)\sim Uniform(0,1)$ o, equivalentemente, $P(θ) \sim Beta[1,1]$
Hipótesis:
- H0: La moneda es justo, $θ\in(0.49, 0.51)$.
- H1: La moneda no es justo, $θ\in[0, 0.49]\cup[0.51, 1]$.
Tenga en cuenta que H0 y H1 son mutuamente excluyentes y que cubren el conjunto [0, 1] rango.
Tengo dos soluciones en las que no puedo encontrar errores, pero se produjo conclusiones contradictorias.
Solución 1: análisis Bayesiano de P(θ|Datos) $$ P(θ|Datos) = \frac{P(Datos|θ) * P(θ)}{P(Datos)} = \frac{P(Datos|θ) * P(θ)}{\int_0^1 P(Datos|θ) * P(θ)\,dθ} $$
Vamos a pluging de Datos = (H=2, T=3), y P(θ)=1 para θ∈[0, 1].
Tenga en cuenta que P(Datos|θ) sigue una distribución Binomial. $$ P(Datos|θ) = θ^2 * (1-θ)^3 $$ Así: $$ P(θ|Datos) = \frac{P(Datos|θ) * P(θ)}{\int_0^1 P(Datos|θ) * P(θ)\,dθ} = \frac{q^2 * (1-θ)^3 * 1.0}{\int_0^1 θ^2 * (1-θ)^3 * 1.0\,dθ} $$ Podemos pegar la expresión anterior en wolframalpha para verificar que el anterior se simplifica a: $$ P(θ|Datos) = 60 (1 - θ)^3 θ^2 $$ También podemos comprobar que este es un buen pdf, ya que se integra a 1 en [0,1].
Ahora podemos calcular P(0.49<θ<0.51|Datos) mediante la integración de P(θ|Datos) a través de [0.49, un 0,51]: $$ \int_{0.49}^{0.51} P(θ|Datos)\,dθ = \int_{0.49}^{0.51} 60*(1 - θ)^3*θ^2\, dθ = 0.03749 $$ Por lo $P(H0|Data) = 0.03749$ $P(H1|Data) = 1 - P(H0 | Data) = 0.96251$
La conclusión es que H1 es mucho más probable que sea correcta: la moneda es probable injusto.
Solución 2: Análisis de datos probabilidad P(Datos|H0) y P(Datos|H1)
Veamos H0 primero: θ∈(0.49, 0.51). Suponiendo que H0 es verdadera, correcta normalizar el uniforme antes de la distribución da P(θ)=50 para θ∈(0.49, 0.51). $$ P(Datos|H0, θ) = θ^2 * (1-θ)^3 $$ Dejando de lado a las más de θ (computación en la expectativa sobre θ): $$ \begin{align} P(Data|H0) & \\&= \int_{0.49}^{0.51} θ^2 * (1-θ)^3 * P(θ)\, dθ \\&= \int_{0.49}^{0.51} θ^2 * (1-θ)^3 * 50 \, dθ \\&= 0.0312417 \end{align} $$ (Una manera rápida de obtener una aproximación a esta integral es simplemente calcular $P(Data|H0, θ=0.5)$, lo que da 1/32=0.03125. También se comprueba la matemática anterior).
Ahora suponemos que H1 es verdadera: θ∈[0, 0.49]∪[0.51, 1]. Suponiendo que H1 es verdadera en su lugar, correctamente normalizar el uniforme antes de la distribución da P(θ)=1/0.98 para θ∈[0, 0.49]∪[0.51, 1]. Usando exactamente el mismo razonamiento: $$ P(Datos|H1, θ) = θ^2 * (1-θ)^3 $$ Dejando de lado a las más de θ (computación en la expectativa sobre θ): $$ \begin{align} P(Data|H1)& \\&= \int_{0}^{0.49} θ^2 * (1-θ)^3 * P(θ)\, dθ + \int_{0.51}^{1} θ^2 * (1-θ)^3 * P(θ)\, dθ \\&= \int_{0}^{0.49} θ^2 * (1-θ)^3 * 1/0.98\, dθ + \int_{0.51}^{1} θ^2 * (1-θ)^3 * 1/0.98\, dθ \\&= 0.0163692 \end{align} $$ Con $P(Data|H0) = 0.0312417$$P(Data|H1) = 0.0163692$, la conclusión es que la moneda es más probable de la feria.
He comprobado mi razonamiento y matemáticas por encima tanto de la solución, y no podía detectar errores. Pero claramente producido conclusiones contradictorias. Alguien me puede ayudar a explicar? Gracias.