Existe una diferencia entre sucesos mutuamente excluyentes y sucesos independientes (de hecho, una diferencia muy estricta en el sentido de que un par de sucesos no triviales no pueden ser a la vez mutuamente excluyentes e independientes).
Eventos $A$ y $B$ son mutuamente excluyentes si es imposible que ambos se produzcan simultáneamente. Tomando prestado su ejemplo, es imposible que el mismo tren se vea implicado en un accidente en Londres (suceso $A$ ) y Nueva York (acontecimiento $B$ ) al mismo tiempo. Así que $\text{P}(A \cap B) = 0$ . Otro ejemplo es, si se lanza un dado una vez, y $A$ y $B$ son los eventos de obtener un $1$ y $6$ (respectivamente). Entonces $A$ se produce, o $B$ o ninguna de las dos. Pero ambos $A$ y $B$ no puede ocurrir. Así que $\text{P}(A \cap B) = 0$ .
Eventos $A$ y $B$ son independiente si la ocurrencia (o no ocurrencia) de una no afecta a la (probabilidad de) ocurrencia de la otra. Dicho de otro modo, $B$ tiene la misma probabilidad de ocurrir independientemente de si $A$ se ha producido o no, y viceversa. Tomando prestado de nuevo su ejemplo, el hecho de que se produzca un accidente de tren en Londres (acontecimiento $A$ ) no cambia normalmente la probabilidad de que se produzca un choque de trenes (con otros trenes implicados) en Nueva York (suceso $B$ ). Digo "normalmente" porque, por supuesto, en el mundo real entran en juego varios factores que podemos desconocer. Por ejemplo, si hay mucha publicidad sobre el accidente de tren en Londres esta semana, podría disminuir mucho la probabilidad de un accidente de tren en Nueva York en las próximas semanas (ya que la gente podría tomar más precauciones de lo habitual).
Pongamos un ejemplo más sencillo. Si se tiran dos dados al mismo tiempo, y $A$ y $B$ son, respectivamente, los eventos de obtener un $1$ en el primer dado y un $6$ en el segundo, entonces $A$ y $B$ son independientes (suponiendo, de nuevo, que no haya una conexión oculta entre los dados a través de las perturbaciones atmosféricas que crean, las ondas gravitacionales, ¡y qué sé yo!). ¿Pueden ocurrir ambas cosas a la vez? Por supuesto, ¿por qué no? Es perfectamente concebible que el primer dado muestre $1$ y el segundo muestra $6$ (como seguro que has visto muchas veces, aproximadamente una treinta y seisava parte de las veces, de hecho, si has jugado al Monopoly). Así que $\text{P}(A \cap B)$ es no $0$ . Para los dados justos, $\text{P}(A) = 1/6$ y $\text{P}(B) = 1/6$ . Entonces, ¿cuál es la probabilidad de que ambos $A$ y $B$ ¿Ocurrir? Simplemente $\text{P}(A)\text{P}(B) = 1/36$ porque los acontecimientos son independientes.
Veamos ahora los sucesos que no son independientes. Ahora mismo estás en Pall Mall y tienes que llegar a la estación de Marylbone en exactamente dos turnos. ¿Cuál es la probabilidad de que esto (llamémoslo suceso $A$ )? Necesita un $4$ para llegar a la estación de Marylbone, y eso puede suceder en exactamente dos turnos sólo si usted consigue $2$ tanto en el primer turno como en el segundo. Por tanto, la probabilidad de $A$ es la probabilidad de obtener la combinación única $(2, 2)$ de todos los $36 \times 36 = 1296$ es decir, las combinaciones posibles, $\text{P}(A) = 1/1296$ . Esto es lo que calculas antes de tirar los dados. Ahora lanzas los dados y obtienes un $2$ (llamemos a este evento $B$ ). ¿Es la probabilidad de $A$ todavía $1/1296$ ? Por supuesto que no. Ahora que conozca que tienes un $2$ y llegado a Whitehall, sabe que sólo necesita un $2$ en el siguiente turno para llegar a la estación de Marylbone, y esto tiene probabilidad $1/36$ . Así, dado que $B$ se produjo la probabilidad de ocurrencia de $A$ cambios. Lo escribimos así $\text{P}(A|B) = 1/36$ (léase "Probabilidad de $A$ dado $B$ "). Esto se denomina probabilidad condicional. Probabilidad condicional de $A$ dado $B$ se define como $\text{P}(A|B) = \dfrac{\text{P}(A \cap B)}{\text{P}(B)}$ . Así, $\text{P}(A \cap B) = \text{P}(B)\text{P}(A|B)$ (suele denominarse Teorema de la multiplicación ).
Para eventos independientes $A$ y $B$ , $\text{P}(A|B) = \dfrac{\text{P}(A \cap B)}{\text{P}(B)} = \dfrac{\text{P}(A)\text{P}(B)}{\text{P}(B)} = \text{P}(A)$ . Esto tiene sentido, ya que esencialmente dice que la probabilidad de $A$ es el mismo si $B$ se produce o no.