144 votos

Intuición detrás de expectativa condicional

Yo estoy luchando con el concepto de esperanza condicional. Primero de todo, si usted tiene un enlace a cualquier explicación que va más allá de mostrar que es una generalización de la educación primaria conceptos intuitivos, por favor hágamelo saber.

Déjame ser más específico. Deje $(\Omega,\mathcal{A},P)$ ser un espacio de probabilidad y $X$ una integración real de la variable aleatoria definida en $(\Omega,\mathcal{A},P)$. Deje $\mathcal{F}$ ser un sub-$\sigma$-álgebra de $\mathcal{A}$. A continuación, $E[X|\mathcal{F}]$ es la una.s. única variable aleatoria $Y$ tal que $Y$ $\mathcal{F}$medible y para cualquier $A\in\mathcal{F}$, $E[X1_A]=E[Y1_A]$.

La interpretación común parece ser: "$E[X|\mathcal{F}]$ es la expectativa de $X$ teniendo en cuenta la información de $\mathcal{F}$." Me estoy encontrando difícil obtener cualquier significado de esta frase.

  1. En primaria la teoría de la probabilidad, la expectativa es un número real. Así que la frase anterior me hace pensar de un número real en lugar de una variable aleatoria. Esto se ve reforzado por $E[X|\mathcal{F}]$ a veces se llama "valor esperado condicional". Hay algunos canónica manera de conseguir los números reales de $E[X|\mathcal{F}]$ que puede ser interpretado como elementales valores esperados de algo?

  2. ¿En qué manera $\mathcal{F}$ proporcionar la información? Saber que algún evento ocurrido, es algo que me gustaría información de la llamada, y tengo una imagen clara de la esperanza condicional en este caso. A me $\mathcal{F}$ no es una pieza de información, sino más bien un juego completo de piezas de información que uno puede adquirir en alguna manera.

Tal vez usted diga que no hay verdadera intuición detrás de esta, $E[X|\mathcal{F}]$ es justamente lo que la definición dice que es. Pero entonces, ¿cómo hace uno para ver que una martingala es un modelo de un juego justo? Sin duda, debe ser algo de la intuición detrás de eso!

Espero que tenga algo de impresión de mis ideas erróneas y pueden rectificar.

165voto

goric Puntos 5230

Tal vez este ejemplo sencillo será de ayuda. Yo lo uso cuando me enseñan esperanza condicional.

(1) El primer paso es pensar en ${\mathbb E}(X)$ una nueva forma: como la mejor estimación del valor de una variable aleatoria $X$, en ausencia de cualquier información. Para minimizar el error cuadrático $${\mathbb E}[(X-e)^2]={\mathbb E}[X^2-2eX+e^2]={\mathbb E}(X^2)-2e{\mathbb E}(X)+e^2,$$ podemos diferenciar para obtener el $2e-2{\mathbb E}(X)$, que es cero en $e={\mathbb E}(X)$.

Por ejemplo, si yo tiro una feria de morir y tienes que la estimación de su valor de $X$, de acuerdo con el análisis anterior, su mejor apuesta es adivinar ${\mathbb E}(X)=3.5$. En específico rollos de morir, esta será una sobre-estimación o una sub-estimación, pero en el largo plazo, se minimiza el error cuadrático medio.

(2) ¿Qué sucede si ¿ tiene más información? Supongamos que te digo que la $X$ es un número par. ¿Cómo se debería modificar su estimación para tomar esta nueva información en cuenta?

El proceso mental que puede ser algo como esto: "Hmmm, los valores posibles se$\lbrace 1,2,3,4,5,6\rbrace$ pero hemos eliminado $1,3$$5$, por lo que el resto de posibilidades se $\lbrace 2,4,6\rbrace$. Ya que no tengo ningún otro tipo de información que debe ser considerado igualmente probables y por lo tanto la versión revisada de la expectativa es $(2+4+6)/3=4$".

Del mismo modo, si yo les dijera a ustedes que $X$ es impar, su revisión (condicional) expectativa es 3.

(3) Ahora imagina que voy a tirar el dado y yo le diré la paridad de $X$; es decir, voy a indicar si el dado sale par o impar. Usted debe ahora ver que un único numérico de la respuesta no puede cubrir ambos casos. Te iba a responder "3" si te digo "$X$ es impar", mientras que respondería "4", si te digo "$X$ es aún". Un único numérico de la respuesta no es suficiente ya que la pieza en particular de la información que voy a dar es en sí azar. De hecho, su respuesta es necesariamente una función de esta pieza particular de información. Matemáticamente, esto se refleja en la exigencia de que ${\mathbb E}(X\ |\ {\cal F})$ debe $\cal F$ medibles.

Creo que esto cubre el punto 1, en su pregunta, y le dice ¿por qué un único número real no es suficiente. También en relación con el punto 2, usted está en lo correcto en decir que el papel de la $\cal F$ ${\mathbb E}(X\ |\ {\cal F})$ no es una pieza única de información, sino más bien dice lo posible de piezas específicas de (azar) de la información pueden ocurrir.

68voto

Reto Meier Puntos 55904

Creo que es una buena manera de responder a la pregunta 2 es el siguiente.

Estoy realizando un experimento, cuyo resultado puede ser descrito por un elemento $\omega$ algunas $\Omega$. No voy a decir el resultado, pero me voy a permitir hacer algunas preguntas sí/no preguntas al respecto. (Esto es como "20 preguntas", pero infinitas secuencias de preguntas será permitido, por lo que es realmente "$\aleph_0$ preguntas".) Podemos asociar a una pregunta de sí/no con el conjunto de $A \subset \Omega$ de los resultados para los que la respuesta es "sí".

Ahora, una manera de describir algunos de la colección de "información" es considerar a todas las preguntas que podrían ser respondidas con la información. (Por ejemplo, el de 2010 de la Enciclopedia Británica es una colección de información; puede responder a las preguntas "Es el extinto dodo?" y "Es el elefante extinto?", pero no a la pregunta "¿Justin Bieber ganar un Grammy 2011?") Esto, entonces, sería un conjunto $\mathcal{F} \subset 2^\Omega$.

Si sé la respuesta a una pregunta $A$, entonces también sé la respuesta a su negación, que corresponde al conjunto $A^c$ (por ejemplo, "Es el dodo no extintos?"). Por lo que cualquier información que es suficiente para contestar la pregunta $A$ también es suficiente para contestar la pregunta $A^c$. Por lo tanto $\mathcal{F}$ debe ser cerrado bajo de tomar complementos. Del mismo modo, si sé la respuesta a las preguntas $A,B$, también sé la respuesta a su disyunción $A \cup B$ ("Son el dodo o el elefante extinto?"), por lo $\mathcal{F}$ también debe ser cerrado bajo (finito) de los sindicatos. Contables de los sindicatos requieren más de un tramo, pero imagino pedirle a una secuencia infinita de preguntas de "convergencia" en una pregunta final. ("Los elefantes viven hasta los 90? Pueden vivir hasta los 99? Pueden vivir hasta el 99,9?" En el final, sé que si los elefantes pueden vivir hasta los 100 años.)

Creo que esto da una idea de por qué un $\sigma$-campo puede ser considerado como una colección de información.

13voto

Mingo Puntos 126

Un ejemplo de ello. Supongamos que $X \sim {\rm binomial}(m,p)$ $Y \sim {\rm binomial}(n,p)$ son independientes ($0 < p < 1$). Para cualquier entero $0 \leq s \leq m+n$, se tiene $$ {\rm E}[X|X + Y = s] = \frac{{m }}{{m + n }}. $$ Esto significa que $$ {\rm E}[X|X + Y] = \frac{{m }}{{m + n }}(X+Y). $$ Tenga en cuenta que ${\rm E}[X|X + Y]$ es una variable aleatoria que es una función de $X+Y$.

Tenga en cuenta que, en general, la esperanza condicional de $X$$Z$, denotado ${\rm E}[X|Z]$, se define como ${\rm E}[X|\sigma(Z)]$ donde $\sigma(Z)$ $\sigma$- álgebra generada por $Z$.

EDIT. En respuesta a la OP de la petición, se me tenga en cuenta que la distribución binomial (que es distinto) no juega ningún papel especial en el ejemplo anterior. Completamente resultados análogos para el normal y gamma de las distribuciones (ambas son continuas) ver este y este, respectivamente; por una importante generalización, ver esto.

10voto

Flatlineato Puntos 226

Se puede pensar la expectativa condicional como la proyección ortogonal sobre el subespacio cerrado de $\mathcal F$-mensurables variables aleatorias en el espacio de Hilbert de cuadrado integrables variables aleatorias.

Esta es una discusión detallada y elemental de este punto de vista.

8voto

Rich Lawrence Puntos 800

Se me ocurrió leer un artículo en la Wikipedia hoy en esperanza Condicional. Para aclarar muchas de mis preguntas. Espero que ayude!

  1. Para tu primera pregunta, en la artículo vinculado, no es el definición de condicional la expectativa de una r.v. $X: \Omega \rightarrow \mathbb{R}$ dado un sub sigma álgebra $\mathcal{F}$ de la una $\mathcal{A}$ sobre el dominio $\Omega$. Es un $\mathcal{F}$medible de la función $: \Omega \rightarrow \mathbb{R}$, se denota como $E(X \vert \mathcal{F})$. Si se evalúa esta condicional expectativa en un punto $\omega \en \Omega$, you will get a value $E(X \vert \mathcal{F})(\omega)$, lo que se llama el condicional la expectativa de $X$ $\mathcal{F}$ $\omega$ .

    Cuando la r.v. $X$ es un indicador de función en algún subconjunto medible decir $A \in \mathcal{A}$, su esperanza condicional dada la sub sigma álgebra se llama el la probabilidad condicional de la subconjunto $A$ dado el sub sigma álgebra $\mathcal{F}$, que se denota como $P( A \vert \mathcal{F})$. Es un asignación: $\Omega \rightarrow \mathbb{R}$.

    Si dejamos $A$ variar dentro de $\mathcal{A}$, el condicional probabilidad $P( \cdot \vert \mathcal{F})$ es un mapeo: $\mathcal{A} \times \Omega \rightarrow \mathbb{R}$. En algunos de los casos, $\forall \omega \in \Omega$, $P( \cdot \vert \mathcal{F})(\omega)$ es un la probabilidad de medir en $(\Omega, \mathcal{F})$, en cuyo caso $P(\cdot \vert \mathcal{F})$ es llama regular condicional la probabilidad.

    Al $\mathcal{F}$ es generado por otro r.v. $Y$, entonces el esperanza condicional y la probabilidad condicional se llama la dada la r.v. $Y$.

  2. Para tu segunda pregunta, todavía estoy wondierng qué tipo de información de una sigma álgebra (de un r.v.) puede proporcionar, y la forma en que se suministra?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X