41 votos

Intuición para la expectativa condicional de $\sigma$ -Álgebra

Dejemos que $(\Omega,\mathscr{F},\mu)$ sea un espacio de probabilidad, dada una variable aleatoria $\xi:\Omega \to \mathbb{R}$ y un $\sigma$ -Álgebra $\mathscr{G}\subseteq \mathscr{F}$ podemos construir una nueva variable aleatoria $E[\xi|\mathscr{G}]$ que es la expectativa condicional.


¿Cuál es exactamente la intuición para pensar en $E[\xi|\mathscr{G}]$ ? Entiendo la intuición de lo siguiente:

(i) $E[\xi|A]$ donde $A$ es un evento (con probabilidad positiva).

(ii) $E[\xi|\eta]$ donde $\eta$ es una variable aleatoria discreta.

Pero no puedo visualizar $E[\xi|\mathscr{G}]$ . Entiendo las matemáticas de la misma, y entiendo que se define de tal manera para generalizar los casos más simples que podemos visualizar. Pero, sin embargo, no encuentro útil esta forma de pensar. Sigue siendo un objeto misterioso para mí.


Por ejemplo, dejemos que $A$ sea un evento con $\mu(A)>0$ . Formar la $\sigma$ -Álgebra $\mathscr{G} = \{ \emptyset, A, A^c, \Omega\}$ la generada por $A$ . Entonces $E[\xi|\mathscr{G}](\omega)$ sería igual a $\frac{1}{\mu(A)} \int_A \xi$ si $\omega \in A$ e igual a $\frac{1}{\mu(A^c)} \int_{A^c} \xi$ si $\omega \not \in A$ . En otras palabras, $E[\xi|\mathscr{G}](\omega) = E[\xi|A]$ si $\omega\in A$ y $E[\xi|\mathscr{G}](\omega) = E[\xi|A^c]$ si $\omega \in A^c$ .

La parte que resulta confusa es que $\omega \in \Omega$ Entonces, ¿por qué no escribimos simplemente $E[\xi|\mathscr{G}](\omega) = E[\xi|\Omega] = E[\xi]$ ? ¿Por qué sustituimos $E[\xi|\mathscr{G}]$ por $E[\xi| A\text{ or } A^c]$ dependiendo de si $\omega\in A$ pero no se puede sustituir $E[\xi|\mathscr{G}]$ por $E[\xi]$ ?


Nota. Al responder a esta pregunta no explique esto utilizando la definición rigurosa de expectativa condicional. Eso lo entiendo. Lo que quiero entender es qué se supone que la expectativa condicional está calculando y por qué rechazamos una en lugar de otra.

43voto

Vamsee Puntos 178

Una forma de pensar en la expectativa condicional es como una proyección sobre el $\sigma$ -Álgebra $\mathscr{G}$ .

enter image description here ( de Wikimedia commons )

Esto es rigurosamente cierto cuando se habla de variables aleatorias cuadradas-integrables; en este caso $\mathbb{E}[\xi|\mathscr{G}]$ es en realidad la proyección ortogonal de la variable aleatoria $\xi$ en el subespacio de $L^2(\Omega)$ que consiste en variables aleatorias medibles con respecto a $\mathscr{G}$ . Y, de hecho, esto incluso resulta ser cierto en cierto sentido para $L^1$ variables aleatorias a través de la aproximación por $L^2$ variables aleatorias.

(Ver las referencias en los comentarios).

Si se considera $\sigma-$ como representación de la cantidad de información que tenemos disponible (una interpretación que es de rigor en la teoría de los procesos estocásticos), entonces mayores $\sigma-$ Las álgebras significan más eventos posibles y, por tanto, más información sobre los posibles resultados, mientras que las $\sigma-$ Las álgebras significan menos eventos posibles y, por tanto, menos información sobre los posibles resultados.

Por lo tanto, la proyección de la $\mathscr{F}$ -variable aleatoria medible $\xi$ en el más pequeño $\sigma-$ álgebra $\mathscr{G}$ significa tomar nuestra mejor conjetura para el valor de $\xi$ dada la información más limitada disponible de $\mathscr{G}$ .

En otras palabras, dada sólo la información de $\mathscr{G}$ y no la totalidad de la información de $\mathscr{F}$ , $\mathbb{E}[\xi|\mathscr{G}]$ es, en un sentido riguroso, nuestra mejor estimación posible de la variable aleatoria $\xi$ es.


Con respecto a tu ejemplo, creo que puedes estar confundiendo las variables aleatorias y sus valores. Una variable aleatoria $X$ es un función cuyo dominio es el espacio de eventos; no es un número. En otras palabras, $X: \Omega \to \mathbb{R}$ , $X \in \{f\ |\ f: \Omega \to \mathbb{R} \}$ mientras que para un $\omega \in \Omega$ , $X(\omega)\in\mathbb{R}$ .

La notación para la expectativa condicional, en mi opinión, es realmente mala, porque es una variable aleatoria en sí misma, es decir, también una función . En cambio, la expectativa (regular) de una variable aleatoria es un número . La expectativa condicional de una variable aleatoria es una cantidad totalmente diferente de la expectativa de la misma variable aleatoria, es decir, $\mathbb{E}[\xi|\mathscr{G}]$ ni siquiera "comprueba el tipo" con $\mathbb{E}[\xi]$ .

En otras palabras, utilizando el símbolo $\mathbb{E}$ para denotar tanto la expectativa regular como la condicional es un abuso muy grande de la notación, que lleva a mucha confusión innecesaria.

Dicho esto, tenga en cuenta que $\mathbb{E}[\xi|\mathscr{G}](\omega)$ es un número (el valor de la variable aleatoria $\mathbb{E}[\xi|\mathscr{G}]$ evaluado en el valor $\omega$ ), pero $\mathbb{E}[\xi|\Omega]$ es una variable aleatoria, pero resulta ser una variable aleatoria constante (es decir, trivial degenerada), porque el $\sigma$ -generada por $\Omega$ , $\{ \emptyset, \Omega\}$ es trivial/degenerada, y entonces técnicamente hablando el valor constante de esta variable aleatoria constante, es $\mathbb{E}[\xi]$ , donde aquí $\mathbb{E}$ denota la expectativa regular y, por tanto, un número, no la expectativa condicional y, por tanto, no una variable aleatoria.

También parece que estás confundido sobre lo que la notación $\mathbb{E}[\xi|A]$ significa; técnicamente hablando sólo es posible condicionar en $\sigma-$ de las álgebras, no de los eventos individuales, ya que las medidas de probabilidad sólo se definen en $\sigma-$ álgebras, no en eventos individuales. Por lo tanto, $\mathbb{E}[\xi|A]$ es sólo una abreviatura (perezosa) de $\mathbb{E}[\xi|\sigma(A)]$ , donde $\sigma(A)$ representa el $\sigma-$ álgebra generada por el evento $A$ que es $\{ \emptyset, A, A^c, \Omega\}$ . Tenga en cuenta que $\sigma(A) = \mathscr{G} = \sigma(A^c)$ En otras palabras, $\mathbb{E}[\xi|A]$ , $\mathbb{E}[\xi|\mathscr{G}]$ y $\mathbb{E}[\xi|A^c]$ son todas formas diferentes de denotar el exactamente el mismo objeto .

Por último, sólo quiero añadir que la explicación intuitiva que he dado anteriormente explica por qué el valor constante de la variable aleatoria $\mathbb{E}[\xi|\Omega]=\mathbb{E}[\xi|\sigma(\Omega)]= \mathbb{E}[\xi| \{ \emptyset, \Omega\}]$ es sólo el número $\mathbb{E}[\xi]$ -- el $\sigma-$ álgebra $\{ \emptyset, \Omega\}$ representa la menor cantidad posible de información que podríamos tener, de hecho, esencialmente ninguna información, así que bajo esta circunstancia extrema la mejor conjetura posible que podríamos tener para qué variable aleatoria $\xi$ es la variable aleatoria constante cuyo valor constante es $\mathbb{E}[\xi]$ .

Nótese que todas las variables aleatorias constantes son $L^2$ variables aleatorias, y todas son medibles con respecto a la trivial $\sigma$ -Álgebra $\{\emptyset, \Omega\}$ , por lo que efectivamente tenemos que la constante aleatoria $\mathbb{E}[\xi]$ es la proyección ortogonal de $\xi$ en el subespacio de $L^2(\Omega)$ consistente en variables aleatorias medibles con respecto a $\{\emptyset, \Omega\}$ como se ha afirmado.

10voto

Nicolas Bourbaki Puntos 342

Voy a tratar de elaborar lo que William sugirió.

Dejemos que $\Omega$ sea el espacio muestral de lanzar una moneda dos veces. Definir el ran. var. $\xi$ para ser el número de cabezas que se producen en el experimento. Claramente, $E[\xi] = 1$ . Una forma de pensar en lo que $1$ como valor expec. representa es como la mejor estimación posible para $\xi$ . Si tuviéramos que adivinar por qué valor $\xi$ tomaría, supondríamos $1$ . Esto se debe a que $E[(\xi - 1)^2] \leq E[(\xi - a)^2]$ para cualquier número real $a$ .

Denota por $A = \{ HT, HH \}$ para el caso de que el primer resultado sea una cabeza. Sea $\mathscr{G} = \{ \emptyset, A, A^c, \Omega\}$ sea el $\sigma$ -alg. gen. por $A$ . Pensamos en $\mathscr{G}$ como representación de lo que sabemos después del primer lanzamiento. Después de la primera tirada, o salió cara, o no salió cara. Por lo tanto, estamos en el evento $A$ o $A^c$ después del primer lanzamiento.

Si estamos en el evento $A$ entonces la mejor estimación posible para $\xi$ sería $E[\xi|A] = 1.5$ y si estamos en el evento $A^c$ entonces la mejor estimación posible para $\xi$ sería $E[\xi|A^c] = 0.5$ .

Ahora define el ran. var. $\eta(\omega)$ para ser $1.5$ o $0.5$ dependiendo de si $\omega\in A$ . Esta corrida. var. $\eta$ es una mejor aproximación que $1 = E[\xi]$ desde $E[(\xi - \eta)^2] \leq E[(\xi -1)^2]$ .

Qué $\eta$ es proporcionar la respuesta a la pregunta: ¿cuál es la mejor estimación de $\xi$ después del primer lanzamiento? Ya que no conocemos la información después del primer lanzamiento, $\eta$ dependerá de $A$ . Una vez que el evento $\mathscr{G}$ se nos revela, después del primer lanzamiento, el valor de $\eta$ se determina y proporciona la mejor estimación posible para $\xi$ .

El problema de utilizar $\xi$ como su propia estimación, es decir $0=E[(\xi - \xi)^2] \leq E[(\xi - \eta)^2]$ es la siguiente. $\xi$ no está bien definida después del primer lanzamiento. Digamos que el resultado del experimento es $\omega$ con el primer resultado de cabeza, estamos en el evento $A$ Pero, ¿qué es? $\xi(\omega)=?$ No lo sabemos desde el primer lanzamiento, ese valor es ambiguo para nosotros, y así $\xi$ no está bien definido. Más formalmente, decimos que $\xi$ no es $\mathscr{G}$ -medible, es decir, su valor no está bien definido después del primer lanzamiento. Por lo tanto, $\eta$ es la mejor estimación posible de $\xi$ después del primer lanzamiento.

Tal vez, alguien aquí puede venir con un ejemplo más sofisticado utilizando el espacio de la muestra $[0,1]$ con $\xi (\omega) = \omega$ y $\mathscr{G}$ algunos no triviales $\sigma$ -Álgebra.

5voto

JanithaR Puntos 141

Aunque pides que no se utilice la definición formal, creo que la definición formal es probablemente la mejor manera de explicarlo.

Wikipedia - expectativa condicional :

Entonces una expectativa condicional de X dada $\displaystyle \scriptstyle {\mathcal {H}}$ , denotado como $\displaystyle \scriptstyle \operatorname {E} (X\mid {\mathcal {H}})$ es cualquier $\displaystyle \scriptstyle {\mathcal {H}}$ -función medible ( $\displaystyle \scriptstyle \Omega \to \mathbb {R} ^{n}$ ) que satisface:

$\displaystyle \int _{H}\operatorname {E} (X\mid {\mathcal {H}})\;dP=\int _{H}X\;dP\qquad {\text{for each}}\quad H\in {\mathcal {H}}$

En primer lugar, es un $\displaystyle \scriptstyle {\mathcal {H}}$ -función medible. En segundo lugar tiene que coincidir con la expectativa sobre cada (sub)conjunto medible en $\displaystyle \scriptstyle {\mathcal {H}}$ . Así, para un evento,A, el álgebra sigma es $ \{A,A^C,\emptyset, \Omega\}$ Así que está claro que se ajusta a lo que especificó en su pregunta para $\omega \in A/A^c$ . De forma similar, para cualquier variable aleatoria discreta (y sus combinaciones), enumeramos todos los sucesos primitivos y asignamos la expectativa dado ese suceso primitivo.

Ahora considere lanzar una moneda un número infinito de veces, donde en cada lanzamiento i, se obtiene $1/2^i$ Si la moneda sale cruz, la ganancia total es $X=\sum _{i=1}^\infty \frac{1}{2^i}c_i$ donde $c_i$ = 1 para las colas y 0 para las cabezas. Entonces X es una variable aleatoria real en $[0,1]$ . Después de n lanzamientos de moneda, se conoce el valor de X con precisión $1/2^n$ Por ejemplo, después de 2 lanzamientos de moneda está en [0,1/4], [1/4,1/2], [1/2,3/4] o [3/4,1] - después de cada lanzamiento de moneda, su álgebra sigma asociada es cada vez más fina, y de manera similar la expectativa condicional de X es cada vez más precisa.

Esperemos que este ejemplo de una variable aleatoria de valor real con una secuencia de álgebras sigma cada vez más fina (Filtración) te aleje de la intuición puramente basada en eventos a la que estás acostumbrado, y aclare su propósito.

0voto

Riemannstein Puntos 11

Para ayudarte un poco más, el caso ii de tu pregunta es un caso especial en el que una álgebra sigma condicionada es generada por una partición. Estoy seguro de que encontrarás ese caso intuitivo también.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X