24 votos

¿Puedo usar prueba de Kolmogorov-Smirnov para comparar dos distribuciones empíricas?

Es ACEPTAR el uso de la prueba de Kolmogorov-Smirnov de bondad de ajuste de prueba para comparar dos distribuciones empíricas para determinar si ellos parecen haber venido de la misma distribución subyacente, en lugar de comparar una distribución empírica a un pre-especificado de referencia de la distribución?

Dejar que me traten de hacer esto de otra manera. Colecciono N muestras de algunos de distribución en un solo lugar. Colecciono M muestras en otro lugar. Los datos es continua (cada muestra es un número real entre 0 y 10, por ejemplo), pero no se distribuye normalmente. Quiero probar si estos N+M muestras provienen de la misma distribución subyacente. Es razonable que el uso de la prueba de Kolmogorov-Smirnov para este propósito?

En particular, podría calcular la distribución empírica $F_0$ de la $N$ de las muestras, y la distribución empírica $F_1$ de la $M$ de las muestras. Entonces, yo podría calcular el test de Kolmogorov-Smirnov estadístico de prueba para medir la distancia entre el$F_0$$F_1$: es decir, calcular los $D = \sup_x |F_0(x) - F_1(x)|$, y el uso de $D$ mi estadístico de prueba como en el test de Kolmogorov-Smirnov de bondad de ajuste. Es este un enfoque razonable?

(He leído en otra parte que el test de Kolmogorov-Smirnov de bondad de ajuste no es válido para distribuciones discretas, pero tengo que admitir que no entienden lo que esto significa o por qué podría ser cierto. ¿Eso significa que mi enfoque propuesto es mala?)

O, ¿usted recomendaría algo a cambio?

28voto

Nathan Long Puntos 30303

Que está bien, y es bastante razonable. Se la conoce como la de dos muestras de prueba de Kolmogorov-Smirnov. La medición de la diferencia entre las dos funciones de distribución por el supnorm es siempre sensible, pero para hacer una formales de prueba que desea conocer la distribución bajo la hipótesis de que las dos muestras son independientes y cada yo.yo.d. de la misma distribución subyacente. Confiar en la habitual teoría asintótica tendrá continuidad del subyacente común de distribución (no de las distribuciones empíricas). Ver la página de la Wikipedia, vinculada a la anterior para más detalles.

En R, puede utilizar el ks.test, que se calcula exacto $p$-valores para tamaños de muestra pequeños.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X