Leo aquí que dada una muestra $ X_1,X_2,...,X_n $ de una distribución continua con fdc $ F_X $ la muestra correspondiente a $ U_i = F_X(X_i) $ sigue una distribución uniforme estándar.
Lo he comprobado mediante simulaciones cualitativas en Python, y he podido verificar fácilmente la relación.
import matplotlib.pyplot as plt
import scipy.stats
xs = scipy.stats.norm.rvs(5, 2, 10000)
fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
scipy.stats.norm.cdf(xs, 5, 2),
bins=50
)
axes[1].set_title("CDF(samples)")
El resultado es el siguiente gráfico:
No soy capaz de entender por qué ocurre esto. Supongo que tiene que ver con la definición del CDF y su relación con el PDF, pero me estoy perdiendo algo...
Agradecería que alguien me indicara alguna lectura sobre el tema o me ayudara a intuirlo.
EDIT: El CDF tiene este aspecto: