8 votos

Empírica De La Función De Distribución De La Comprensión

Estoy estudiando este tema por mí mismo, y estoy bastante seguro de que habrá algún gran malentendido de mi parte, así que por favor sea paciente conmigo.

Dado que la muestra $X_1,\ldots, X_n$, iid con la distribución de $F$, el Empírico (Acumulado) Función de Distribución (FED) es el azar la probabilidad de medida $F_N:\mathbb{R}\rightarrow [0,1]$, de tal manera que $$F_N(x)=\frac{1}{N}\sum_{i=1}^NI(X_i \leq x)$$

donde $I$ es el indicador de la función.

Mis problemas son acerca de la definición de sí mismo. Además de las explicaciones, los ejemplos también son bienvenidos. Sólo quiero conseguir una buena comprensión de lo que está pasando. Aquí van mis dudas:

1) $\frac{1}{N}\sum_{i=1}^NI(X_i \leq x)$ es una suma de funciones, no un valor real en $[0,1]$, en caso de ser $\frac{1}{N}\sum_{i=1}^NI(X_i \leq x)(x)$ o algo más ? ¿Cómo debo interpretar y calcular el $I(X_i \leq x)$ ?

2) ¿Qué es exactamente un ejemplo? En este momento, creo que es un vector $(X_1(\omega),\ldots,X_N(\omega))$ donde $\omega$ es algunos fijos evento (que por alguna razón nadie nunca se menciona) y el $X_i$ son aleatorios "variables aleatorias" a partir del conjunto de variables aleatorias con distribución $F$. Se podría dar una definición formal de la muestra?

3) En mi entendimiento, $X_i\leq x=\{\omega\in\Omega: \ X_i(\omega)\leq x\}$, es necesario evaluar $X_i(\omega)$ algunos $\omega$ que calcula el $I(X_i\leq x)$. Ya veo la definición de $I(X_i\leq x)=1 \textrm{ if }X_i\leq x \textrm{, or }0\textrm{ otherwise}$, ¿cómo se me supone saber si $X_i\leq x$ sin algunas de las $\omega\in\Omega$? Y por qué el conjunto de eventos que nunca se menciona?

4) $F_N$ se llama una distribución, pero ellos dicen que es una medida de probabilidad, también he leído que es una variable aleatoria. Después de todo, ¿qué es?

5) Si $F_N$ es una medida de probabilidad, la función debe ser $F_N:\Sigma\rightarrow[0,1]$ donde $\Sigma$ $\sigma-$ álgebra $\mathbb{R}$, pero ese no es el caso, ¿cómo explicar que?

PS: si hay algún detalle extra que uno quiere, porque es relevante, por favor. Necesito entender, pero es realmente difícil hacerlo yo mismo.

Muchas gracias.

10voto

Joel Puntos 2169

Deje que nos indican nuestra probabilidad de espacio por $(\Omega,\mathcal{F},P)$ y deje $X_1,X_2,\ldots,X_n$ ser una secuencia de yo.yo.d. variables aleatorias definidas en $\Omega$.

Usted está en lo correcto que $\{X_i\leq x\}$ es la notación abreviada para $\{\omega\in\Omega\mid X_i(\omega)\leq x\}$ que es un subconjunto de a $\Omega$ que pertenece a $\mathcal{F}$ (desde $X_i$ es una variable aleatoria). Además, en $I(X_i\leq x)$ es la función del indicador para el conjunto de $\{X_i\leq x\}\subseteq\Omega$ y, por definición, es una función definida en el $\Omega$ (en realidad es una variable aleatoria ya que el conjunto pertenece a $\mathcal{F}$): $$ \begin{align} I(X_i\leq x)(\omega)&= \begin{cases} 1,\quad \text{if }\omega\in \{X_i\leq x\},\\ 0,\quad \text{otherwise}. \end{casos} \\ &= \begin{cases} 1,\quad\text{if }X_i(\omega)\leq x,\\ 0,\quad\text{otherwise}. \end{casos} \end{align} $$

Por lo tanto, $\frac1n \sum_{i=1}^n I(X_i\leq x)$ es también una variable aleatoria para cada uno de ellos fijo $n$.

Un ejemplo de esta conexión sólo denota una secuencia de yo.yo.d. variables aleatorias $X_1,\ldots,X_n$. Un resultado de este ejemplo corresponde a un fijo $\omega$, e $X_1(\omega),\ldots,X_n(\omega)$ sería un resultado de la observación de la muestra $X_1,\ldots,X_n$.

La distribución empírica de la función de $F_n(x)=\frac1n \sum_{i=1}^n I(X_i\leq x)$ es de hecho una variable aleatoria, y podemos evaluar de la siguiente manera: $$ (F_n(x))(\omega)=\frac1n\sum_{i=1}^n I(X_i(\omega)\leq x), $$ es decir, para un resultado fijo $\omega\in\Omega$, $(F_n(x))(\omega)$ es el número de observaciones que están a menos de $x$ dividido por $n$ sobre la base del resultado $X_1(\omega),X_2(\omega),\ldots,X_n(\omega)$.

Ahora supongamos que tenemos una infinita muestra de yo.yo.d. variables $X_1,X_2,\ldots$. Luego por la ley de los grandes números uno tiene que para todos los fijos $x$, las variables aleatorias $F_1(x), F_2(x),F_3(x)$ converge casi seguramente a la verdadera CDF $F$: $$ F_n(x)\a F(x)\;\;\text{casi seguramente como } n\to\infty. $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X