El denominador, $\Pr(\textrm{data})$ se obtiene integrando los parámetros de la probabilidad de unión, $\Pr(\textrm{data}, \textrm{parameters})$ . Esta es la probabilidad marginal de los datos y, por supuesto, no depende de los parámetros, ya que éstos se han integrado.
Ahora, ya que:
- $\Pr(\textrm{data})$ no depende de los parámetros para los que se quiere hacer la inferencia;
- $\Pr(\textrm{data})$ suele ser difícil de calcular de forma cerrada;
se suele utilizar la siguiente adaptación de la fórmula de Baye:
$\Pr(\textrm{parameters} \mid \textrm{data}) \propto \Pr(\textrm{data} \mid \textrm{parameters}) \Pr(\textrm{parameters})$
Básicamente, $\Pr(\textrm{data})$ no es más que una "constante de normalización", es decir, una constante que hace que el la densidad posterior se integra a uno .