En estas situaciones es bueno recordar que la división se define a menudo como la inversa de la multiplicación: $x = b/a$ si $ax =b$ . Siempre que te encuentres con alguna división complicada, puedes escribirla en términos de una ecuación que implique la multiplicación. Por ejemplo, puedes definir la probabilidad condicional como la solución de la siguiente ecuación: $$ x= P(A|B) \quad \text{ if } \quad P(A\cap B) = x\cdot P(B) $$ o pasando a la fórmula de la probabilidad total, dada una partición finita $(H_i)$ del espacio de probabilidad, las correspondientes probabilidades condicionales $x_i = P(A|H_i)$ debe satisfacer $$ P(A) = \sum_i x_i(A) P(H_i) \qquad \forall A $$ Ahora, pasar a un caso general parece fácil: basta con poner una integral más general en lugar de una suma. Es decir, $$ P(A) = \int x_\omega(A) P(\mathrm d\omega) \qquad \forall A \tag{1} $$ es la definición (implícita) de la probabilidad condicional (regular). Nótese que la solución de $(1)$ sólo es única con casi total seguridad, por lo que para cualquier suceso nulo se puede cambiar la función de probabilidad condicional $x_\omega(\cdot)$ y seguirá resolviendo esta ecuación. Por esta razón, a menudo sólo hay que adivinar cuál es un buen candidato para la probabilidad condicional, y luego demostrar que resuelve la ecuación deseada. Por ejemplo, el ejemplo de Did parece muy natural, aunque podemos cambiarlo arbitrariamente en números racionales, y seguir obteniendo una probabilidad condicional válida. En este caso, por supuesto $E[X|Y]$ puede diferir de $\frac12 Y$ para los números racionales.
Descargo de responsabilidad: $(1)$ no es perfectamente formal, pero dará una intuición.
Editar: En cuanto a la pregunta del primer comentario, esto es exactamente lo que se hace. Una vez definida la expectativa condicional, es natural decir que la probabilidad condicional se define por $P(A|\mathcal F) = E[1_A|\mathcal F]$ . Ahora, la regla de la torre nos da exactamente $(1)$ : $$ P(A) = E[1_A] = E[E[1_A|\mathcal F]] = \int E[1_A|\mathcal F](\omega) P(\mathrm d\omega) $$ para que $E[1_A|\mathcal F](\omega)$ es un buen candidato para $x_\omega(A)$ . El único problema es que para algunos fijos $\omega$ puede ocurrir que $E[1_A|\mathcal F](\omega)$ no es una medida en función de $A$ - Recordemos que la expectativa condicional sólo se define $P$ -a.s. de forma única, por lo que en algún conjunto nulo puede comportarse de forma bastante extraña. Por esta razón, distinguimos probabilidades condicionales regulares - esas versiones de $E[1_A|\mathcal F](\omega)$ que son la medida de la probabilidad en función de $A$ para cada fijo $\omega$ . Hay algunos espacios medibles y medidas de probabilidad en ellos que no admiten versiones regulares, sin embargo, para los espacios de Borel funciona bien - es posible que desee googlear sobre esto si está interesado en los detalles.
0 votos
Este es un ejemplo que se preguntó anteriormente: math.stackexchange.com/questions/236998/
0 votos
@DavidK gracias, pero ese hilo no muestra cómo usamos la expectativa condicional para derivar las probabilidades condicionales cuando el evento condicionante tiene $0$ probabilidad.