Una posibilidad es que la tercera muestra introduzca variabilidad adicional o viole supuestos para la prueba de Kruskal-Wallis, por lo que no puede encontrar diferencias entre las tres muestras. Aquí hay un ejemplo (usando R):
# generar y mostrar datos falsos
set.seed(1234) # para reproducibilidad
x1 = runif(5, 1, 4); x2 = rnorm(5, 1, 1); x3 = rnorm(5, 1, 5)
x123 = c(x1, x2, x3); g123 = rep(1:3, each=5)
x12 = c(x1, x2); g12 = rep(1:2, each=5)
stripchart(x123 ~ g123, pch="|", ylim=c(.5,3.5))
La prueba de la suma de rangos de Mann-Whitney-Wilcoxon y la prueba de Kruskal-Wallis encuentran una diferencia significativa entre x1
y x2
al nivel del 5%, con valores de P alrededor del 3%:
wilcox.test(x12 ~ g12)
Prueba de la suma de rangos de Wilcoxon
data: x12 por g12
W = 23, valor P = 0.03175
hipótesis alternativa: la verdadera diferencia de ubicación no es igual a 0
kruskal.test(x12 ~ g12)
Prueba de la suma de rangos de Kruskal-Wallis
datos: x12 por g12
Chi-cuadrado de Kruskal-Wallis = 4.8109, df = 1, valor P = 0.02828
Sin embargo, la prueba de Kruskal-Wallis no encuentra diferencias significativas entre x1
, x2
, y x3
al nivel del 5%:
kruskal.test(x123 ~ g123)
Prueba de la suma de rangos de Kruskal-Wallis
datos: x123 por g123
Chi-cuadrado de Kruskal-Wallis = 5.58, df = 2, valor P = 0.06142