6 votos

¿Es necesario indicar la mediana o la media cuando se utiliza una prueba de Kruskal-Wallis?

Tengo dos grupos. Hay una diferencia significativa según la prueba KW. Pero, ¿tengo que informar de la media o la mediana de los grupos?

15voto

dan90266 Puntos 609

La prueba de Wilcoxon/Kruskal-Wallis no es para la media ni para la mediana, aunque la mediana puede estar más cerca de lo que la prueba está probando. El estimador que es consistente con la prueba es el estimador de Hodges-Lehmann. Véase http://en.wikipedia.org/wiki/Mann-whitney y http://en.wikipedia.org/wiki/Hodges%E2%80%93Lehmann_estimate . En R puedes hacer los cálculos fácilmente - ver por ejemplo http://biostat.mc.vanderbilt.edu/WilcoxonSoftware .

12voto

JMW.APRN Puntos 21

Se dice que la prueba de Kruskal-Wallis comprueba si la mediana es la misma en cada grupo. De acuerdo con esa sencilla regla, debe informar de la mediana, que es mi respuesta a su pregunta.

Sin embargo, esto me da la ocasión de mostrar que el KW no es realmente una prueba de la mediana. La hipótesis alternativa de la prueba es no que una de las distribuciones tiene una mediana diferente. Es que una de las distribuciones tiene exactamente la misma forma que las otras, pero está desplazada hacia arriba o hacia abajo.

Aquí hay un pequeño fragmento de R que demuestra esto. Creo dos muestras con la misma mediana (es decir, 0) y aplico la prueba de Kruskal-Wallis.

set.seed(123)
x <- exp(rnorm(100))
y <- exp(rnorm(100))
x <- x - median(x)
y <- median(y) - y
# Both x and y have median 0.
kruskal.test(list(x,y))

Resulta que el valor p es de 0,005676, que parece muy bajo para dos muestras con exactamente la misma mediana. Esto se debe a que las muestras están tomadas de distribuciones muy sesgadas en direcciones opuestas (la muestra x tiene una fuerte cola en el lado derecho y y en el lado izquierdo).

¿Se equivoca la prueba KW? No. Es correcto rechazar la hipótesis nula de que las muestras se toman de la misma distribución.

Así que la conclusión es que no se puede concluir que hay una diferencia en la mediana sólo porque se rechace la hipótesis nula . También puede rechazar la hipótesis nula por falta de independencia, o como se muestra en el ejemplo anterior porque las distribuciones no tienen las mismas formas.

Creo que no es necesario mencionar todo esto al informar de la mediana, pero son elementos que debes tener en cuenta cada vez que hagas la prueba.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X