8 votos

Dos muestras unilaterales de Kolmogorov-Smirnov, prueba vs unilateral Wilcoxon-Mann-Whitney

He leído en la biblioteca de un manual para la prueba de ks.test que

Los posibles valores de "dos.cara", "menor que" y "mayor" de la alternativa de especificar la hipótesis nula de que la verdadera función de distribución de x es igual a, no menos que o no mayor que la hipótesis de la función de distribución (un caso de ejemplo) o la función de distribución de y (de dos muestras de caso), respectivamente. Esta es una comparación de funciones de distribución acumulativa, y el estadístico de prueba es la máxima diferencia en el valor, con la estadística en la "mayor" de la alternativa D^+ = max[F_x(u) - F_y(u)]. Así, en el caso del ejemplo de la alternativa = "mayor" incluye las distribuciones para los cuales x es estocásticamente menor que y (el CDF de x se encuentra por encima y por ende, a la izquierda de que para y), en contraste con t.prueba o wilcox.prueba.

Desafortunadamente no he logrado entender esta diferencia entre (supongo que a una cara) wilcox.test y ks.test. Parece, que la prueba de ambos para el desplazamiento de una distribución con respecto a otra. ¿Alguien puede arrojar algo de luz sobre ella, por favor?

8voto

Eero Puntos 1612

Ambas son pruebas para el desplazamiento de la variable x con respecto a la y variable, pero las 2 pruebas tienen significados opuestos por el término "mayor" (y por ello también o "menos").

En la ks.test "mayor" significa que la CDF de 'x' es mayor que la CDF de la 'y' lo que significa que cosas como la media y la mediana será menor que los valores de 'x' que en 'y' si la CDF de la " x " es "mayor" que la CDF de 'y'. En 'wicox.prueba' y 't.la prueba de la media, la mediana, etc. será mayor en la 'x' que en 'y' si usted cree que la alternativa de la "mayor" es cierto.

Un ejemplo de R:

> x <- rnorm(25)
> y <- rnorm(25, 1)
> 
> ks.test(x,y, alt='greater')

        Two-sample Kolmogorov-Smirnov test

data:  x and y 
D = 0.6, p-value = 0.0001625
alternative hypothesis: two-sided 

> wilcox.test( x, y, alt='greater' )

        Wilcoxon rank sum test

data:  x and y 
W = 127, p-value = 0.9999
alternative hypothesis: true location shift is greater than 0 

> wilcox.test( x, y, alt='less' )

        Wilcoxon rank sum test

data:  x and y 
W = 127, p-value = 0.000101
alternative hypothesis: true location shift is less than 0 

Aquí me genera 2 muestras de una distribución normal, tanto con el tamaño de la muestra 25 y desviación estándar de 1. El x variable proviene de una distribución de media 0 y el y variable a partir de una distribución de media de 1. Usted puede ver los resultados de ks.test dan un resultado significativo de pruebas en el "mayor" de la dirección aunque x tiene el medio menor, esto es debido a que la CDF de x está por encima de la de y. El wilcox.test función de muestra de la falta de significación en el "mayor" de la dirección, pero similar nivel de significación en el "menos" de dirección.

Ambas pruebas son diferentes enfoques de las pruebas de la misma idea, pero lo de "mayor" y "menor" significa las 2 pruebas son diferentes (y conceptualmente opuesto).

7voto

JMW.APRN Puntos 21

No estoy de acuerdo con R y @GregSnow en este punto. Aquí es por qué.

set.seed(123)
x <- rnorm(25)
y <- rnorm(25, sd=5)
ks.test(x, y, alternative='greater')
#    Two-sample Kolmogorov-Smirnov test
#
# data:  x and y
# D^+ = 0.44, p-value = 0.007907
# alternative hypothesis: the CDF of x lies above that of y
#
ks.test(x, y, alternative='less')
#    Two-sample Kolmogorov-Smirnov test
#
# data:  x and y
# D^- = 0.36, p-value = 0.03916
# alternative hypothesis: the CDF of x lies below that of y

En el caso de que las varianzas son diferentes, la CDF de x se encuentra por encima y por debajo de la de y. Para rechazar la cara hipótesis no quiere decir nada acerca de la media o la mediana. Incluso no decir nada acerca de dominancia estocástica.

Usted puede encontrar más información acerca de esta idea errónea de allí y algunos de discusión allí. En mi opinión, la cara KS prueba teórico atractivo, pero es malo para extraer una conclusión sobre el primer momento de ella. Para este propósito, la prueba de Wilcoxon es más apropiado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X