Una forma de pensar en la expectativa condicional es como una proyección sobre el $\sigma$ -Álgebra $\mathscr{G}$ .
( de Wikimedia commons )
Esto es rigurosamente cierto cuando se habla de variables aleatorias cuadradas-integrables; en este caso $\mathbb{E}[\xi|\mathscr{G}]$ es en realidad la proyección ortogonal de la variable aleatoria $\xi$ en el subespacio de $L^2(\Omega)$ que consiste en variables aleatorias medibles con respecto a $\mathscr{G}$ . Y, de hecho, esto incluso resulta ser cierto en cierto sentido para $L^1$ variables aleatorias a través de la aproximación por $L^2$ variables aleatorias.
(Ver las referencias en los comentarios).
Si se considera $\sigma-$ como representación de la cantidad de información que tenemos disponible (una interpretación que es de rigor en la teoría de los procesos estocásticos), entonces mayores $\sigma-$ Las álgebras significan más eventos posibles y, por tanto, más información sobre los posibles resultados, mientras que las $\sigma-$ Las álgebras significan menos eventos posibles y, por tanto, menos información sobre los posibles resultados.
Por lo tanto, la proyección de la $\mathscr{F}$ -variable aleatoria medible $\xi$ en el más pequeño $\sigma-$ álgebra $\mathscr{G}$ significa tomar nuestra mejor conjetura para el valor de $\xi$ dada la información más limitada disponible de $\mathscr{G}$ .
En otras palabras, dada sólo la información de $\mathscr{G}$ y no la totalidad de la información de $\mathscr{F}$ , $\mathbb{E}[\xi|\mathscr{G}]$ es, en un sentido riguroso, nuestra mejor estimación posible de la variable aleatoria $\xi$ es.
Con respecto a tu ejemplo, creo que puedes estar confundiendo las variables aleatorias y sus valores. Una variable aleatoria $X$ es un función cuyo dominio es el espacio de eventos; no es un número. En otras palabras, $X: \Omega \to \mathbb{R}$ , $X \in \{f\ |\ f: \Omega \to \mathbb{R} \}$ mientras que para un $\omega \in \Omega$ , $X(\omega)\in\mathbb{R}$ .
La notación para la expectativa condicional, en mi opinión, es realmente mala, porque es una variable aleatoria en sí misma, es decir, también una función . En cambio, la expectativa (regular) de una variable aleatoria es un número . La expectativa condicional de una variable aleatoria es una cantidad totalmente diferente de la expectativa de la misma variable aleatoria, es decir, $\mathbb{E}[\xi|\mathscr{G}]$ ni siquiera "comprueba el tipo" con $\mathbb{E}[\xi]$ .
En otras palabras, utilizando el símbolo $\mathbb{E}$ para denotar tanto la expectativa regular como la condicional es un abuso muy grande de la notación, que lleva a mucha confusión innecesaria.
Dicho esto, tenga en cuenta que $\mathbb{E}[\xi|\mathscr{G}](\omega)$ es un número (el valor de la variable aleatoria $\mathbb{E}[\xi|\mathscr{G}]$ evaluado en el valor $\omega$ ), pero $\mathbb{E}[\xi|\Omega]$ es una variable aleatoria, pero resulta ser una variable aleatoria constante (es decir, trivial degenerada), porque el $\sigma$ -generada por $\Omega$ , $\{ \emptyset, \Omega\}$ es trivial/degenerada, y entonces técnicamente hablando el valor constante de esta variable aleatoria constante, es $\mathbb{E}[\xi]$ , donde aquí $\mathbb{E}$ denota la expectativa regular y, por tanto, un número, no la expectativa condicional y, por tanto, no una variable aleatoria.
También parece que estás confundido sobre lo que la notación $\mathbb{E}[\xi|A]$ significa; técnicamente hablando sólo es posible condicionar en $\sigma-$ de las álgebras, no de los eventos individuales, ya que las medidas de probabilidad sólo se definen en $\sigma-$ álgebras, no en eventos individuales. Por lo tanto, $\mathbb{E}[\xi|A]$ es sólo una abreviatura (perezosa) de $\mathbb{E}[\xi|\sigma(A)]$ , donde $\sigma(A)$ representa el $\sigma-$ álgebra generada por el evento $A$ que es $\{ \emptyset, A, A^c, \Omega\}$ . Tenga en cuenta que $\sigma(A) = \mathscr{G} = \sigma(A^c)$ En otras palabras, $\mathbb{E}[\xi|A]$ , $\mathbb{E}[\xi|\mathscr{G}]$ y $\mathbb{E}[\xi|A^c]$ son todas formas diferentes de denotar el exactamente el mismo objeto .
Por último, sólo quiero añadir que la explicación intuitiva que he dado anteriormente explica por qué el valor constante de la variable aleatoria $\mathbb{E}[\xi|\Omega]=\mathbb{E}[\xi|\sigma(\Omega)]= \mathbb{E}[\xi| \{ \emptyset, \Omega\}]$ es sólo el número $\mathbb{E}[\xi]$ -- el $\sigma-$ álgebra $\{ \emptyset, \Omega\}$ representa la menor cantidad posible de información que podríamos tener, de hecho, esencialmente ninguna información, así que bajo esta circunstancia extrema la mejor conjetura posible que podríamos tener para qué variable aleatoria $\xi$ es la variable aleatoria constante cuyo valor constante es $\mathbb{E}[\xi]$ .
Nótese que todas las variables aleatorias constantes son $L^2$ variables aleatorias, y todas son medibles con respecto a la trivial $\sigma$ -Álgebra $\{\emptyset, \Omega\}$ , por lo que efectivamente tenemos que la constante aleatoria $\mathbb{E}[\xi]$ es la proyección ortogonal de $\xi$ en el subespacio de $L^2(\Omega)$ consistente en variables aleatorias medibles con respecto a $\{\emptyset, \Omega\}$ como se ha afirmado.