He estado revisando la selección de modelos bayesianos, donde la probabilidad de los datos dado el modelo se define con la siguiente ecuación: $$p(y|M_k) = \int p(y|\theta)p(\theta|M_k)d\theta$$ Según tengo entendido, $p(y|\theta)$ es simplemente la distribución de y bajo los parámetros que ya hemos definido. Estoy un poco confundido por el término $p(\theta|M_k)$ . Sé que podemos reescribirlo con la regla de Bayes: $$p(\theta|M_k) = p(\theta)p(M_k|\theta)$$ Supongo que podemos encontrar el valor de $p(\theta)$ utilizando la distribución de probabilidad Beta. Pero lo que ocurre con $p(M_k|\theta)$ ? ¿Cómo estimamos la probabilidad del modelo dados los parámetros? Parece que deberíamos estimar la probabilidad de la distribución de probabilidad dados sus parámetros, así que tal vez sea un problema de distribución Dirichlet?
No sé qué hacer con esto $p(M_k|\theta)$ término, estará muy agradecido si me lo puede explicar.