86 votos

La intuición detrás de complementarios CDF para calcular la expectativa para no negativo de las variables aleatorias

He leído la prueba de por qué $\int_0^\infty P(X >x)dx=E[X]$ para no negativo de las variables aleatorias (se encuentra aquí) y entender su mecánica, pero estoy teniendo problemas para entender la intuición detrás de esta fórmula o por qué debería ser el caso en absoluto. ¿Alguien tiene alguna idea sobre esto? Apuesto a que me estoy perdiendo algo obvio.

Gracias!

140voto

Martin OConnor Puntos 116

Para el caso discreto, y si $X$ es no negativa, $E[X] = \sum_{x=0}^\infty x P(X = x)$. Eso significa que estamos sumando $P(X = 0)$ cero veces, $P(X = 1)$ una vez, $P(X = 2)$ dos veces, etc. Esto puede ser representado en la matriz de la forma, donde estamos añadiendo la columna por columna:

$$\begin{matrix} P(X=1) & P(X = 2) & P(X = 3) & P(X = 4) & P(X = 5) & \cdots \\ & P(X = 2) & P(X = 3) & P(X = 4) & P(X = 5) & \cdots \\ & & P(X = 3) & P(X = 4) & P(X = 5) & \cdots \\ & & & P(X = 4) & P(X = 5) & \cdots \\ & & & & P(X = 5) & \cdots\end{matrix}.$$

También podríamos agregar estos números de fila por fila, sin embargo, y obtener el mismo resultado. La primera fila tiene de todo pero de $P(X = 0)$, por lo sumas a $P(X > 0)$. La segunda fila tiene de todo pero de $P(X =0)$$P(X = 1)$, por lo sumas a $P(X > 1)$. En general, la suma de la fila $x+1$$P(X > x)$, y por lo que agregar los números de fila por fila nos da $\sum_{x = 0}^{\infty} P(X > x)$, lo que también debe ser igual a $\sum_{x=0}^\infty x P(X = x) = E[X].$

La continua caso es análogo.

En general, los cambios en el orden de la suma (como en la prueba de la OP enlaces a) siempre puede ser interpretado como la adición de fila por fila frente de la columna por columna.

17voto

Did Puntos 1

Una sugerencia y una prueba.

Sugerencia: si $X=x$ con total probabilidad, la integral es la integral de la $1$$(0,x)$, de ahí la LHS y RHS son tanto $x$.

Prueba: aplicar (Tonelli-)Fubini para la función de $(\omega,x)\mapsto\mathbf 1_{X(\omega)>x}$ y el sigma-finito de medida $P\otimes\mathrm{Leb}$$\Omega\times\mathbb R_+$. Uno se $$ \int_\Omega\int_{\mathbb R_+}\mathbf 1_{X(\omega)>x}\mathrm dx\mathrm dP(\omega)=\int_\Omega\int_0^{X(\omega)}\mathrm dx\mathrm dP(\omega)=\int_\Omega X(\omega)\mathrm dP(\omega)=E(X), $$ mientras, el uso de la taquigrafía $A_x=\{\omega\in\Omega\mid X(\omega)>x\}$, $$ \int_{\mathbb R_+}\int_\Omega\mathbf 1_{X(\omega)>x}\mathrm dP(\omega)\mathrm dx=\int_{\mathbb R_+}\int_\Omega\mathbf 1_{\omega\en A_x}\mathrm dP(\omega)\mathrm dx=\int_{\mathbb R_+}P(A_x)\mathrm dx=\int_{\mathbb R_+}P(X>x)\mathrm dx. $$

13voto

Dilip Sarwate Puntos 14967

Desde la intuición detrás de los resultados que se solicita, vamos a considerar un caso simple de un discreto no negativo de la variable aleatoria tomando en los tres valores $x_0 = 0$, $x_1$, y $x_2$ con probabilidades $p_0$, $p_1$, y $p_2$. La función de distribución acumulativa (CDF) $F(x)$ es por lo tanto una escalera función $$F(x) = \begin{cases} 0, & x < 0, \\ p_0, & 0 \leq x < x_1,\\ p_0 + p_1, & x_1 \leq x < x_2,\\ 1, & x \geq x_2, \end{casos}$$ con saltos de $p_0$, $p_1$, y $p_2$ a $0$, $x_1$, y $x_2$ respectivamente. Tenga en cuenta también que $$ E[X]= \sum_{i=1}^3 p_ix_i = p_1x_1 + p_2x_2. $$ Ahora, observe que $$\int_0^\infty P\{X > x\}\mathrm dx = \int_0^\infty [1 - F(x)]\mathrm dx$$ es el área de la región limitada por la curva de $F(x)$, el eje vertical, y la línea a la altura de la 1 sobre el eje horizontal. Estándar Riemann técnicas de integración decir que debemos dividir la región en estrechas tiras verticales, calcular el área de cada uno, tomar la suma, tomar límites, etc. En nuestro ejemplo, por supuesto, todo esto puede ser evitado desde la región en cuestión es la unión de dos contiguas que no se solapan los rectángulos: uno de base $x_1$ y la altura de la $(1-p_0)$, y el otro de base $x_2 - x_1$, y la altura de la $(1-p_0-p_1)$. PERO, supongamos que queremos dividir la región bajo consideración en dos diferentes adyacentes no se solapan los rectángulos con el segundo está por encima de la primera. El primer rectángulo tiene de base $x_1$ y la altura de la $p_1$, mientras que el segundo (acostado encima de la primera) tiene base más amplia $x_2$ y la altura de la $p_2$. El área total que buscamos es fácilmente visto $p_1x_1 + p_2x_2 = E[X]$.

Por lo tanto, para un no-negativo de la variable aleatoria, $E[X]$ puede interpretarse como el área de de la región situada por encima de sus CDF $F(x)$ y por debajo de la línea de altura de la 1 a la a la derecha del origen. La fórmula estándar $$E[X] = \int_0^\infty x\mathrm dF(x)$$ puede ser pensado como la informática en esta área a través de su división en finas horizontales bandas de longitud de $x$ y la altura de la $dF(x)$, mientras que $$\int_0^\infty P\{X > x\}\mathrm dx = \int_0^\infty [1 - F(x)]\mathrm dx$$ (en el sentido integral de Riemann) puede ser pensado como calcular el área de división en finas tiras verticales.

Más generalmente, si $X$ toma valores positivos y negativos, $$E[X] = \int_0^\infty [1 - F(x)]\mathrm dx - \int_{-\infty}^0 F(x) \mathrm dx$$ con las interpretaciones similares.

5voto

bgee Puntos 327

Tal vez por considerar a esta pregunta con un concreto ejemplo físico, esto proporcionará un poco de intuición.

Considere la posibilidad de una viga de longitud $L = 10$ (usted puede elegir su favorito de unidades) fijado a la pared. Ahora, en las posiciones $1, 2, \ldots, 9$ colgar las pesas $w_1,w_2,\ldots,w_9$. Para simplificar, vamos a suponer que $\sum_{n=1}^9 w_n = 1$.

Entonces el centro de masa de la viga es de $c = \sum_{n=1}^n 9 w_n$. a continuación un ejemplo de una foto, con los pesos en azul (alturas proporcional a la masa) y el centro de masa en rojo.

enter image description here

En un probabilística de la configuración, en nuestra pesos corresponden a probabilidades y $c = \mathbb E X$ donde $X$ toma los valores $1,2,\ldots,9$ con probabilidades de $w_1,w_2,\ldots,w_9$, respectivamente.

Ahora, para explicar cómo la $c = \mathbb E X = \sum_{n=0}^9 \mathbb P(X > n) = \sum_{n = 0}^9 \sum_{k=n+1}^9 w_k$ viene, la expansión de esta última suma tenemos $$ c = (w_1 + \cdots + w_9) + (w_2 + \cdots + w_9) + \cdots + (w_9) \>, $$ por eso, $w_1$ aparece una vez, $w_2$ aparece dos veces, $w_3$ aparece tres los tiempos, etc. Por lo tanto $c = \sum_{n=1}^9 n w_n$.

En términos de la viga, se puede pensar en la expresión $\sum_{n=0}^9 \mathbb P(X > n)$ de la siguiente manera. De pie en cero, mirar a la derecha y el recuento de todos los pesos en frente de usted. Ahora, damos un paso a la derecha y repita este proceso, añadiendo el resultado a su inicial suma. Continúe este proceso hasta llegar a la posición 9, en el que el punto es que no hay más pesos en frente de usted.

La suma resultante es el centro de masa, o, en términos probabilísticos, la expectativa $\mathbb E X$.

La ampliación de esta intuición discretas variables aleatorias tomando en valores no enteros, es sencillo. La extensión para las variables continuas no es también difícil.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X