62 votos

¿Qué significa integrar con respecto a la función de distribución?

Si $f(x)$ es una función de densidad y $F(x)$ es una función de distribución de una variable aleatoria $X$ entonces entiendo que la expectativa de x se suele escribir como

$$E(X) = \int x f(x) dx$$

donde los límites de integración están implícitos $-\infty$ y $\infty$ . La idea de multiplicar x por la probabilidad de x y sumar tiene sentido en el caso discreto, y es fácil ver cómo se generaliza al caso continuo. Sin embargo, en el libro de Larry Wasserman Todas las estadísticas escribe la expectativa de la siguiente manera:

$$E(X) = \int x dF(x)$$

Supongo que mi cálculo está un poco oxidado, en el sentido de que no estoy muy familiarizado con la idea de integrar sobre funciones de $x$ en lugar de sólo $x$ .

  • ¿Qué significa integrar sobre la función de distribución?
  • ¿Existe un proceso análogo a la suma repetida en el caso discreto?
  • ¿Existe una analogía visual?

ACTUALIZACIÓN: Acabo de encontrar el siguiente extracto del libro de Wasserman (p.47):

La notación $\int x d F(x)$ merece algún comentario. Lo utilizamos simplemente como una conveniente notación unificadora para no tener que escribir $\sum_x x f(x)$ para variables aleatorias discretas y $\int x f(x) dx$ para variables aleatorias continuas, pero hay que tener en cuenta que $\int x d F(x)$ tiene un significado preciso que se discute en un análisis real real.

Por lo tanto, me interesaría cualquier idea que se pueda compartir sobre ¿cuál es el significado preciso que se discutiría en un curso de análisis real?

41voto

Bruce Puntos 3473

Hay muchas definiciones de la integral, incluyendo la integral de Riemann, la integral de Riemann-Stieltjes (que generaliza y amplía la integral de Riemann), y la integral de Lebesgue (que es aún más general.) Si se utiliza la integral de Riemann, entonces sólo se puede integrar con respecto a una variable (por ejemplo $x$ ), y la notación $dF(x)$ no está definido.

La integral de Riemann-Stieltjes generaliza el concepto de la integral de Riemann y permite la integración con respecto a una función de distribución acumulativa que no es continua.

La notación $\int_{a}^{b} g(x)dF(x)$ es más o menos equivalente a $\int_{a}^{b} g(x) f(x) dx$ cuando $f(x)=F'(x)$ . Sin embargo, si $F(x)$ es una función que no es diferenciable en todos los puntos, entonces simplemente no se puede evaluar $\int_{a}^{b} g(x) f(x) dx$ ya que $f(x)=F'(x)$ no está definido.

En teoría de la probabilidad, esta situación se produce siempre que se tiene una variable aleatoria con una función de distribución acumulativa discontinua. Por ejemplo, supongamos que $X$ es $0$ con probabilidad $\frac{1}{2}$ y $1$ con probabilidad $\frac{1}{2}$ . Entonces

$$ \begin{align} F(x) &= 0 & x &< 0 \\ F(x) &= 1/2 & 0 &\leq x < 1 \\ F(x) &= 1 & x &\geq 1 \\ \end{align} $$

Claramente, $F(x)$ no tiene un derivado en $x=0$ o $x=1$ , por lo que no hay una función de densidad de probabilidad $f(x)$ en esos puntos.

Ahora, supongamos que queremos evaluar $E[X^3]$ . Esto se puede escribir, utilizando la integral de Riemann-Stieltjes, como

$$E[X^3]=\int_{-\infty}^{\infty} x^3 dF(x).$$

Nótese que como no hay una función de densidad de probabilidad $f(x)$ no podemos escribir esto como

$$E[X^{3}]=\int_{-\infty}^{\infty} x^3 f(x) dx.$$

Sin embargo, podemos utilizar el hecho de que esta variable aleatoria es discreta para evaluar el valor esperado como:

$$E[X^{3}]=(0)^{3}(1/2)+(1)^{3}(1/2)=1/2$$

Así que la respuesta corta a tu pregunta es que necesitas estudiar definiciones alternativas de la integral, incluyendo las integrales de Riemann y Riemann-Stieltjes.

33voto

Joel Puntos 2169

Otra forma de entender la integración con respecto a una función de distribución es a través de la medida de Lebesgue-Stieltjes. Sea $F\!:\mathbb R\to\mathbb R$ sea una función de distribución (es decir, no decreciente y continua hacia la derecha). Entonces existe una única medida $\mu_F$ en $(\mathbb{R},\mathcal{B}(\mathbb{R}))$ que satisface $$ \mu_F((a,b])=F(b)-F(a) $$ para cualquier elección de $a,b\in\mathbb R$ con $a<b$ . En realidad, existe una correspondencia uno a uno entre las medidas de probabilidad sobre $(\mathbb{R},\mathcal{B}(\mathbb{R}))$ y funciones no decrecientes y continuas por la derecha $F\!:\mathbb R\to\mathbb R$ satisfaciendo $F(x)\to 1$ pour $x\to\infty$ y $F(x)\to 0$ pour $x\to-\infty$ .

Ahora, la integral $$ \int x\,\mathrm dF(x) $$ puede considerarse simplemente como la integral $$ \int x\,\mu_F(\mathrm dx)\quad\text{or}\quad \int x \,\mathrm d\mu_F(x). $$

Ahora bien, si $X$ es una variable aleatoria que tiene una función de distribución $F$ entonces la medida de Lebesgue-Stieltjes no es más que la distribución $P_X$ de $X$ : $$ P_X((a,b])=P(X\in (a,b])=P(X\leq b)-P(X\leq a)=F(b)-F(a)=\mu_F((a,b]),\quad a<b, $$ demostrando que $P_X=\mu_F$ . En particular, vemos que $$ {\rm E}[X]=\int_\Omega X\,\mathrm dP=\int_\mathbb{R}x\,P_X(\mathrm dx)=\int_\mathbb{R}x\,\mu_F(\mathrm dx)=\int_\mathbb{R}x\,\mathrm dF(x). $$

2 votos

Esta es una respuesta más antigua, pero lo intentaré de todos modos: ¿cómo se puede entender $\int_\mathbb{R} x \mu_{F}(dx)$ ? Nunca he visto esa anotación y no estoy seguro de lo que se supone que significa.

1 votos

@DahnJahn: Como Integral de Lebesgue .

1 votos

Gracias, ah, entonces es simplemente un problema de notación y $\int d\mu = \int \mu(dx)$ ¿por definición?

16voto

SUMIT MITRA Puntos 16

La integral es en el sentido de Riemann-Stieltjes . La definición se puede encontrar en el enlace, pero a grandes rasgos se define algo así:

$$\int_a^b g(x)dF(x)=\lim_{P\rightarrow 0} \sum_{k=1}^{n-1} g(x_k)[F(x_{k+1})-F(x_k)],$$

donde $x_i$ particionar el intervalo sobre el que se está integrando, $[a,b]$ y el tamaño de la malla va a 0, en ese $P:=\{x_0=a,x_1,\ldots, x_{n-1},x_n=b\}$ y $x_i-x_{i-1}\rightarrow 0$ por cada $i$ . El sentido de esta definición es que $F(x_{k+1})-F(x_k)$ encapsula la probabilidad de estar dentro del intervalo $(x_{i},x_{i+1}]$ . Cuando $F$ es diferenciable, se puede demostrar que $dF(x)=f(x)dx$ en que la integral se convierte en la integral de Riemann habitual. Sin embargo, cuando $F$ no es diferenciable, especialmente cuando $F$ experimenta un salto (que equivale a que tu variable aleatoria tome un único valor con probabilidad positiva), necesitas esta generalización de la integral. Por ejemplo, si $X$ es una variable aleatoria constante, por ejemplo $X=c$ entonces $F(x)$ salta de 0 a 1 en $x=c$ y así $X$ no tiene una función de densidad en el sentido clásico, sino una masa puntual (es decir, un funcional Delta de Dirac).

-2voto

Entimon Puntos 27

La definición de dF(x) es f(x). F(x) es la función de distribución acumulativa (también conocida como CDF). f(x) es la función de densidad de probabilidad (PDF). Compruébalo tú mismo: http://mathworld.wolfram.com/DistributionFunction.html

0 votos

Porque $f(x)=F'(x)$ ? Por lo tanto, puede sustituir $dF(x)$ con $f(x)dx$ ?

1 votos

Gracias. Entiendo que la función de densidad es la derivada de la función de distribución; supongo que la brecha en mi comprensión es probablemente en torno a la notación integral en particular el concepto de $dF(x)$ en la integral y la idea de sustituir $dF(X)$ con otra cosa.

4 votos

Decir que la definición de $dF(x)$ es $f(x)$ funciona SÓLO cuando la distribución tiene una densidad. No se aplica a cosas como la distribución de Cantor, aunque la f.d.c. de esa distribución es continua en todas partes.

-2voto

S. Abdoulaziz Puntos 1

Porque dF(x) (CDF) es una función continua en cualquiera de los dos casos; f(x) es discreta o en el caso f(x) continua.

En otras palabras, en el caso de que f(x) sea discreta F(x) sería como una función escalonada [como en la FIGURA 2.1. página 21], curva continua, mientras que f(x) se representaría como un conjunto de puntos no conectados entre sí, entonces no es apropiado usar el signo integral, pero en el caso de que f(x) sea continua no importa si usamos dF(x) o f(x)dx.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X