8 votos

¿El MAP es el valor máximo del posterior o su moda?

Según la definición de MAP de WP:

En estadística bayesiana, una estimación de probabilidad a posteriori máxima (MAP) es una estimación de una cantidad desconocida, que iguala al modo de la distribución posterior.

(énfasis añadido) que, dado un posterior $f(\theta \mid x)$, puede ser definido como:

$$\hat{\theta}_{\mathrm{MAP}}(x) = \underset{\theta}{\operatorname{arg\,max}} \ f(\theta \mid x) $$

Por lo que entiendo, el modo de una distribución depende de cómo construyo su histograma (o KDE). Esto me parece estar en contradicción con la definición anterior, donde el MAP es el valor de $\theta$ encontrado para el máximo de la muestra de $f(\theta \mid x)$ y no depende de nada más.

¿Qué me estoy perdiendo?

11voto

Taylor Puntos 692

En estadísticas bayesianas, una estimación de máxima probabilidad a posteriori (MAP, por sus siglas en inglés) es una estimación de una cantidad desconocida que equivale a la moda de la distribución posterior.

Esto es correcto.

Por lo que entiendo, la moda de una distribución depende de cómo construyo su histograma (o KDE). Esto me parece estar en contradicción con la definición anterior, donde el MAP es el valor máximo encontrado para la fórmula muestral f(x) y no depende de nada más.

Estás confundiendo cantidades teóricas con las basadas en muestreo/aleatorias. La posterior se define por la verosimilitud y la previa. Es decir, $f(x) = \frac{L(\theta)\pi(\theta)}{\int_{\Theta} L(\theta')\pi(\theta') d \theta' }$ donde $L(\theta)$, $\pi(\theta)$ son la verosimilitud y la previa, respectivamente. Esta es una función única en $\theta.

En la práctica, es común muestrear de esta distribución, y si ese es el caso, estás introduciendo error aleatorio. Por lo general, cuando se hace esto, es la única opción porque, digamos, la constante de normalización no estará disponible. Estrategias populares obtienen muestras de $f(\theta|x)$ y solo requieren que el usuario pueda evaluar la posterior sin normalizar $L(\theta)\pi(\theta)$. Aunque esto es solo una aproximación porque está basada en extracciones aleatorias, hay resultados que garantizan la convergencia de tus estimadores, por lo que el error es tolerable siempre que se ejecuten las simulaciones el tiempo suficiente.

2 votos

Entonces, si entendí lo que dijiste: el modo teórico de $f(\theta\mid x)$ siempre es igual a su valor máximo (MAP), pero como estoy usando un $f(\theta\mid x)$ muestreado, ¿el modo y el MAP no necesariamente coincidirán?

1 votos

@gabriel correct

5voto

jkabrg Puntos 151

El MAP es el valor $\theta$ para el cual $f(\theta | x)$ alcanza su valor máximo.

-1voto

Peter Puntos 181

El modo de distribución es el valor con mayor probabilidad (para variables aleatorias discretas) o el punto con mayor valor de densidad de probabilidad (para variables aleatorias continuas). Entonces sí, el modo de la distribución a posteriori es la estimación MAP.

Hay que tener en cuenta que, al construir un histograma, no se conoce la distribución real, lo que significa que el "modo" que encuentras es solo una estimación de en qué intervalo hay más probabilidad asociada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X