Sé de PIT pero esto sólo funciona cuando se conoce la distribución, o al menos se tiene una pista fuerte. Lo que trato de conseguir es transformar una muestra dada en una muestra equivalente con distribución uniforme estándar continua.
Tengo una muestra de tamaño $n$ . Elijo arbitrariamente un valor $m$ y estimar $m+1$ cuantiles (por ejemplo, si $m=4$ calculo los cuantiles para $\{0, .25, .5, .75, 1\}$ ). El procedimiento se describe en Wikipedia .
Utilizando los cuantiles transformo cada $x_i$ . Si $x_i$ resulta ser exactamente un cuantil calculado, entonces conozco exactamente su valor equivalente, de lo contrario interpolo el valor equivalente linealmente.
He hecho una pequeña simulación. Construyo una muestra aleatoria de la normal estándar con $10^6$ valores. He aplicado la transformación descrita y hago la prueba KS para algunos valores de $m$ . Los resultados se ven así:
m D p-value
100 0.006090 0.000000000000 ***
200 0.003151 0.000000004733 ***
300 0.001991 0.000720875707 ***
400 0.001484 0.024403417075 *
500 0.001057 0.213437843144
Parece que puedo hacer un EIF sobre muestra con sólo 500 puntos de interpolación.
La pregunta es: ¿puedo utilizar la bondad de ajuste de una muestra de Kolmogorov-Smirnov para encontrar un valor adecuado para $m$ (el número de cuantiles computados)?