5 votos

CDF multidimensional en un soporte discreto

Supongamos que tengo dos tarjetas de apoyo a las variables aleatorias, $X$ e $Y$.

Tienen conjunta CDF $F(X,Y)$.

Si quiero encontrar

$\Pr(a \leq X \leq b , c \leq Y \leq d)$.

Es evidente que no:

$F(b ,d)-F(a-1 ,c-1)$.

Qué es entonces, en términos más simples con respecto a la CDF?

Yo creo que para dos dimensiones, esto es:

$F(b ,d)-F(a-1 ,d)-F(b,c-1)+F(a-1,c-1)$.

¿Qué es un arbitrario $d$ dimensiones?

3voto

jldugger Puntos 7490

La función de distribución (CDF) de una variable aleatoria $X=(X_1,X_2,\ldots, X_n)$ con valores en $\mathbb{R}^n$ se define como

$$F_X(x_1,x_2,\ldots, x_n) = \Pr(X_1\le x_1,\, X_2\le x_2,\ \ldots,\ X_n\le x_n).$$

Para encontrar la probabilidad de que $X$ se encuentra dentro de algunos vacío (medio abierto) parallelipiped $$\mathcal{I} = (i_1,j_1] \times (i_2,j_2] \times \cdots \times (i_n,j_n]$$

(o, equivalentemente, para encontrar la probabilidad de que simultáneamente $i_k \lt X_k \le j_k$ para $k=1,2,\ldots,n$), simplificar el problema mediante la elección de los ejes de coordenadas centrado en $(i_1,i_2,\ldots,i_n)$ con la unidad de distancias $j_k-i_k.$ Esto hace que todos los $i_k$ igual a $0$ y todas las $j_k$ igual a $1:$ $\mathcal I$ se convierte en la unidad de cubo en $\mathbb{R}^n.$ (Esto es simplemente una conveniencia notacional en lugar de un cambio de cualquier matemático sustancia.)

Mediante la partición de la última coordenada en la no-valores positivos y valores de menos de o igual a $1,$ observar que la unidad de cubo, sólo como un conjunto, puede ser expresado como la diferencia de

$$\mathcal{I} = \mathcal{I}^{(1)}\setminus\mathcal{I}^{(0)}$$

donde (para cualquier número real $s$) $$\mathcal{I}^{(s)} = (0,1]\times(0,1]\times \cdots \times (0,1] \times (-\infty, s].$$

Los axiomas de la probabilidad (en concreto, que las probabilidades de no intersección de las regiones agregar) implica

$$\eqalign{ \Pr(X\in\mathcal{I}) &= \Pr(X\in\mathcal{I}^{(1)}) - \Pr(X\in\mathcal{I}^{(0)}) \\ Y= F(1,1,\ldots,1,1) - F(1,1,\ldots,1,0). }$$

La repetición de esta reducción en las coordenadas $n-1,$ $n-2, ...$ hacia $1$ se doble el número de términos en cada iteración. La combinación resultante, por tanto, ha $2^n$ términos. Todos los términos son de la forma $\pm F(s_1,s_2,\ldots,s_n)$ con $s_j\in\{0,1\},$ y por lo tanto son diferentes: no hay algebraicas simplificación. El signo está determinado por el número de ceros en los argumentos de $F$negativas: por un número impar, que es positivo para un número par.

Este resultado se puede escribir como una suma iterada sobre $n$ variables,

$$\Pr(X\in (0,1]^n) = \sum_{s_1\in\{0,1\}}\sum_{s_2\in\{0,1\}}\cdots \sum_{s_n\in\{0,1\}}(-1)^{n-\sum_{j=1}^n s_j}\ F(s_1,s_2, \ldots, s_n).$$

En una forma más breve y memorable vector de notación, donde $\mathbf{s} = (s_1,s_2,\ldots,s_n)$ e $|\mathbf{s}| = s_1+s_2+\cdots+s_n,$ podemos escribir

$$\Pr(X\in (0,1]^n) = \sum_{\mathbf{s}\in\{0,1\}^n} (-1)^{n-|\mathbf{s}|} \ F(\mathbf{s}).$$

Cuando $n=3,$ , por ejemplo, este es

$$\Pr(X\in \mathcal (0,1]^3) = F(1,1,1)-F(1,1,0)-F(1,0,1)-F(0,1,1)+F(1,0,0)+F(0,1,0)+F(0,0,1)-F(0,0,0).$$

En términos de las coordenadas originales esto sería escrito

$$\Pr(X\in \mathcal I) = F(j_1,j_2,j_3)-F(j_1,j_2,i_3)-F(j_1,i_2,j_3)-F(i_1,j_2,j_3)+F(j_1,i_2,i_3)+F(i_1,j_2,i_3)+F(i_1,i_2,j_3)-F(i_1,i_2,i_3).$$

Finalmente, cuando se $X$ es compatible con la integral de celosía $\mathbb{Z}^n$ (de los vectores cuyas coordenadas son números enteros), porque

$$\Pr(X_j \lt x) = \Pr(X_j \le x-1),$$

usted puede reemplazar cada una de las $i_k$ por $i_k-1$ encontrar la probabilidad de que $X$ se encuentra en la cerrada parallelipiped $$\bar{\mathcal{I}} = [i_1,j_1]\times \cdots \times [i_n,j_n].$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X