49 votos

¿Por qué la FCD de una muestra está uniformemente distribuida?

Leo aquí que dada una muestra $ X_1,X_2,...,X_n $ de una distribución continua con fdc $ F_X $ la muestra correspondiente a $ U_i = F_X(X_i) $ sigue una distribución uniforme estándar.

Lo he comprobado mediante simulaciones cualitativas en Python, y he podido verificar fácilmente la relación.

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

El resultado es el siguiente gráfico:

Plot showing the sample of a normal distribution and the cdf of the sample.

No soy capaz de entender por qué ocurre esto. Supongo que tiene que ver con la definición del CDF y su relación con el PDF, pero me estoy perdiendo algo...

Agradecería que alguien me indicara alguna lectura sobre el tema o me ayudara a intuirlo.

EDIT: El CDF tiene este aspecto:

CDF of the sampled distribution

46voto

Hunaphu Puntos 622

Supongamos que $F_X$ es continua y creciente. Definir $Z = F_X(X)$ y observe que $Z$ toma valores en $[0, 1]$ . Entonces $$F_Z(x) = P(F_X(X) \leq x) = P(X \leq F_X^{-1}(x)) = F_X(F_X^{-1}(x)) = x.$$

Por otro lado, si $U$ es una variable aleatoria uniforme que toma valores en $[0, 1]$ , $$F_U(x) = \int_R f_U(u)\,du =\int_0^x \,du =x.$$

Así, $F_Z(x) = F_U(x)$ por cada $x\in[0, 1]$ . Desde $Z$ et $U$ tiene la misma función de distribución $Z$ también debe ser uniforme en $[0, 1]$ .

19voto

alexs77 Puntos 36

Intuitivamente, quizás tenga sentido pensar en $F(x)$ como una función percentil, por ejemplo $F(x)$ de una muestra generada aleatoriamente de la DF $F$ se espera que caiga por debajo de $x$ . Alternativamente $F^{-1}$ (piensa en imágenes inversas, no en una función inversa propiamente dicha por sí mismo ) es una función "cuantil". Es decir, $x = F^{-1}(p)$ es el punto $x$ detrás de la cual cae $p$ proporción de la muestra. La composición funcional es mensurablemente conmutativa $F \circ F^{-1} =_\lambda F^{-1} \circ F$ .

La distribución uniforme es la única que tiene una función cuantil igual a una función percentil: son la función de identidad. Así que el espacio de la imagen es el mismo que el espacio de la probabilidad. $F$ mapas continuo variables aleatorias en un espacio (0, 1) con igual medida. Ya que para dos percentiles cualesquiera $a < b$ tenemos $P(F^{-1}(a) < x < F^{-1}(b)) = P(a < F(X) < b) = b-a$

14voto

Ramesh Raja Puntos 21

He aquí una intuición. Utilicemos un ejemplo discreto.

Digamos que después de un examen las calificaciones de los estudiantes son $X = [10, 50, 60, 90]$ . Pero quieres que las puntuaciones sean más parejas o uniformes. $h(X) = [25, 50, 75, 100]$ se ve mejor.

Una forma de conseguirlo es encontrar los percentiles de la puntuación de cada alumno. Puntuación $10$ es $25\%$ , puntuación $50$ es $50\%$ y así sucesivamente. Obsérvese que el percentil no es más que la FCD. Así que la FCD de una muestra es "uniforme".

Cuando $X$ es una variable aleatoria, el percentil de $X$ es "uniforme" (por ejemplo, el número $X$ 's en $0-25$ percentil debe ser el mismo que el número de $X$ 's en $25-50$ percentil). Por lo tanto, la FCD de $X$ se distribuye uniformemente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X