Bien, ahora que has actualizado tu pregunta para incluir las dos fórmulas:
$$P(A\mid B) = \frac{P(A\cap B)}{P(B)} ~~ \text{provided that } P(B) > 0, \tag{1}$$ es el definición de la probabilidad condicional de $A$ dado que $B$ ocurrido. Igualmente, $$P(B\mid A) = \frac{P(B\cap A)}{P(A)} = \frac{P(A\cap B)}{P(A)} ~~ \text{provided that } P(A) > 0, \tag{2}$$ es el definición de la probabilidad condicional de $B$ dado que $A$ ocurrido. Ahora bien, es cierto que es una cuestión trivial sustituir el valor de $P(A\cap B)$ de $(2)$ en $(1)$ a llegar a $$P(A\mid B) = \frac{P(B\mid A)P(A)}{P(B)} ~~ \text{provided that } P(A), P(B) > 0, \tag{3}$$ que es Fórmula de Bayes pero observe que la fórmula de Bayes en realidad conecta dos diferente probabilidades condicionales $P(A\mid B)$ y $P(B\mid A)$ y es esencialmente una fórmula para "dar la vuelta al condicionamiento". El reverendo Thomas Bayes se refirió a esto en términos de "probabilidad inversa" e incluso hoy en día, hay sobre si la inferencia estadística debe basarse en la probabilidad inversa. basada en $P(B\mid A)$ o la probabilidad inversa (denominada el a posteriori o probabilidad posterior).
Sin duda es tan irritante para ti como lo fue para mí la primera vez que descubrí que la fórmula de Bayes no era más que una sustitución trivial de $(2)$ en $(1)$ . Quizás si hubieras nacido hace 250 años, usted (Nota: el OP se hizo pasar por el nombre de usuario AlphaBetaGamma cuando escribí esta respuesta, pero desde entonces ha cambiado su nombre de usuario) podría haber hecho la sustitución y luego la gente hoy estaría hablando de la fórmula AlphaBetaGamma y la herejía AlfaBetaGamma y el método ingenuo AlfaBetaGamma $^*$ en su lugar de invocar el nombre de Bayes en todas partes. Así que permítame consolarle por su pérdida de fama señalándole una versión diferente de la fórmula de Bayes. versión de la fórmula de Bayes. La ley de la probabilidad total dice que $$P(B) = P(B\mid A)P(A) + P(B\mid A^c)P(A^c) \tag{4}$$ y utilizando esto, podemos escribir $(3)$ como
$$P(A\mid B) = \frac{P(B\mid A)P(A)}{P(B\mid A)P(A) + P(B\mid A^c)P(A^c)}, \tag{5}$$ o más generalmente como $$P(A_i\mid B) = \frac{P(B\mid A_i)P(A_i)}{P(B\mid A_1)P(A_1) + P(B\mid A_2)P(A_2) + \cdots + P(B\mid A_n)P(A_n)}, \tag{6}$$ donde la probabilidad posterior de una posible "causa" $A_i$ de un "dato" $B$ está relacionado con $P(B\mid A_i)$ la probabilidad de que observación $B$ cuando $A_i$ es la hipótesis verdadera y $P(A_i)$ la probabilidad a priori (¡horror!) de la hipótesis $A_i$ .
$^*$ Allí es un famoso artículo de R. Alpher, H. Bethe y G. Gamow, "The Origin of Chemical Elements", Physical Review, 1 de abril de 1948, que se conoce comúnmente como el $\alpha\beta\gamma$ papel .