59 votos

¿Cuál es la diferencia entre la distribución posterior y la distribución predictiva posterior?

Entiendo lo que es un Posterior, pero no estoy seguro de lo que significa este último.

¿En qué se diferencian los dos?

Kevin P Murphy indicó en su libro de texto, Aprendizaje automático: una perspectiva probabilística que es "un estado de creencia interno". ¿Qué significa eso realmente? Tenía la impresión de que un Prior representa su creencia interna o sesgo, ¿dónde me equivoco?

68voto

La simple diferencia entre ambos es que la distribución posterior depende del parámetro desconocido $\theta$ es decir, la distribución posterior es: $$p(\theta|x)=c\times p(x|\theta)p(\theta)$$ donde $c$ es la constante de normalización.

Mientras que, por otro lado, la distribución predictiva posterior no depende del parámetro desconocido $\theta$ porque se ha integrado, es decir, la distribución predictiva posterior es: $$p(x^*|x)=\int_\Theta c\times p(x^*,\theta|x)d\theta=\int_\Theta c\times p(x^*|\theta)p(\theta|x)d\theta$$

donde $x^*$ es una nueva variable aleatoria no observada e independiente de $x$ .

No me detendré en la explicación de la distribución posterior ya que dices que la entiendes pero la distribución posterior "es la distribución de una cantidad desconocida, tratada como una variable aleatoria, condicionada a las pruebas obtenidas" (Wikipedia). Así que, básicamente, es la distribución que explica tu parámetro desconocido, aleatorio.

Por otro lado, el distribución predictiva posterior tiene un significado completamente diferente, ya que es la distribución de los datos previstos en el futuro, basada en los datos que ya se han visto. Así que la distribución predictiva posterior se utiliza básicamente para predecir nuevos valores de datos.

Si sirve de ayuda, es un gráfico de ejemplo de una distribución posterior y una distribución predictiva posterior:

enter image description here

enter image description here

19voto

matt Puntos 11

La distribución predictiva se suele utilizar cuando se ha aprendido una distribución posterior para el parámetro de algún tipo de modelo predictivo. Por ejemplo, en la regresión lineal bayesiana, se aprende una distribución posterior sobre el parámetro w del modelo y=wX dados algunos datos observados X.
Entonces, cuando llega un nuevo punto de datos no visto x*, se quiere encontrar la distribución sobre las posibles predicciones y* dada la distribución posterior para w que se acaba de aprender. Esta distribución sobre posibles y* dada la posterior para w es la distribución de predicción.

18voto

Bill Mark Puntos 51

Se refieren a distribuciones de dos cosas diferentes.

La distribución posterior se refiere a la distribución de la parámetro mientras que la distribución posterior predictiva (PPD) se refiere a la distribución de observaciones futuras de los datos .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X