En el libro de Sheldon Ross, First Course in Probability, introduce los estadísticos de orden y pasa a derivar una fórmula para su distribución utilizando el siguiente razonamiento:
En primer lugar, para las estadísticas de pedidos $X_{(1)},...,X_{(n)}$ para tomar valores $x_1\le ... \le x_n$ las variables aleatorias $(X_1,...,X_n)$ debe ser igual a $(x_{i_1},...,x_{i_n})$ para alguna permutación $(i_1,...,i_n)$ de $(1,...,n)$ .
Entonces debemos calcular $$p=P\{ x_{i_1}-\frac \epsilon 2 < X_1 <x_{i_1}+\frac \epsilon 2,...,x_{i_n}-\frac \epsilon 2 <X_n<x_{i_n}+\frac \epsilon 2\} \approx \epsilon^n f(x_1)\cdots f(x_n)$$ De ello se deduce que, como hay $n!$ diferentes formas en que las variables aleatorias pueden igualar los valores dados, tenemos que $$p=n!\epsilon^n f(x_1)\cdots f(x_n)$$ Hasta aquí, entiendo, sin embargo, es cuando dice:
"Dividiendo por $\epsilon^n$ y dejar que $\epsilon \to 0$ "
Lo que me desconcierta. Entiendo que hagamos la aproximación mediante la derivada de la FCD y que podamos multiplicar las probabilidades porque las variables aleatorias son independientes. Sin embargo, no entiendo por qué dividimos por $\epsilon^n$ para obtener la PDF de las estadísticas de pedidos. ¿Por qué lo hacemos?
Respuesta
¿Demasiados anuncios?Dejemos que $\nu(dx)=f(x)\,\lambda_1(dx)$ sea una medida de probabilidad y $\nu_n(d\mathbf{x})= f(x_1)\cdots f(x_n)\,\lambda_n(d\mathbf{x})$ la medida del producto. El mapa $T:\mathbf{x}=(x_1,\ldots,x_n)\mapsto (x_{(1)},\ldots,x_{(n)})$ , donde $x_{(1)}\leq\ldots x_{(k)}\leq\ldots x_{(n)}$ se denomina mapa de estadísticas de pedidos .
Si $B=\{[y_1,\ldots,y_n]: y_1<\ldots < y_n\}$ entonces para cada permutación $\sigma$ en $\{1,\ldots,n\}$ hay un mapa lineal uno a uno $P_{\sigma}: B\rightarrow \mathbb{R}^n$ tal que $T\circ P_{\sigma}=I_n$ la identidad en $B$ . Es fácil comprobar que $\lambda_n(\mathbb{R}^n\setminus\bigcup_{\sigma\in\Sigma_n}P_\sigma(B))=0$ . Los mapas $P_\sigma$ están representados por matrices con exactamente una $1$ en cada fila y cada columna y $\det(P_\sigma)=\pm1$ . Entonces, $\lambda_n\circ T^{-1}\ll\lambda_n$ y $$ \begin{align} \frac{\lambda_n\circ T^{-1}}{d\lambda_n}(\mathbf{y}):=f_T(y_1,\ldots,y_n)=\sum_{\sigma\in\Sigma_n}|\det(P_\sigma)| f(y_{\sigma(1)})\cdots f(y_{\sigma(n)})&= n! f(y_1)\cdots f(y_n) \mathbb{1}_{B}(\mathbf{y})\tag{1}\label{order} \end{align} $$