31 votos

Diferencia entre la prueba de ANOVA y la de Kruskal-Wallis

Estoy aprendiendo R y he estado experimentando con el análisis de la varianza. He estado ejecutando ambos

kruskal.test(depVar ~ indepVar, data=df)

y

anova(lm(depVar ~ indepVar, data=dF))

¿Hay alguna diferencia práctica entre estas dos pruebas? Entiendo que ambas evalúan la hipótesis nula de que las poblaciones tienen la misma media. Gracias de antemano

43voto

AdamSane Puntos 1825

Hay diferencias en los supuestos y las hipótesis que se ponen a prueba.

El ANOVA (y la prueba t) es explícitamente una prueba de igualdad de medias de valores. El Kruskal-Wallis (y el Mann-Whitney) puede considerarse técnicamente como una comparación de la media rangos .

Por lo tanto, en términos de valores originales, el Kruskal-Wallis es más general que una comparación de medias: comprueba si la probabilidad de que una observación aleatoria de cada grupo esté igualmente por encima o por debajo de una observación aleatoria de otro grupo. La cantidad de datos real que subyace a esa comparación no es ni la diferencia de medias ni la diferencia de medianas, (en el caso de dos muestras) es en realidad la mediana de todas las diferencias por pares - la diferencia entre muestras de Hodges-Lehmann.

Sin embargo, si se opta por hacer algunas suposiciones restrictivas, entonces Kruskal-Wallis puede considerarse como una prueba de igualdad de las medias de la población, así como de los cuantiles (por ejemplo, las medianas) y, de hecho, de una amplia variedad de otras medidas. Es decir, si se asume que las distribuciones de grupo bajo la hipótesis nula son las mismas, y que bajo la alternativa, el único cambio es una distribución turno (un llamado " alternativa al cambio de ubicación "), entonces también es una prueba de igualdad de las medias de la población (y, simultáneamente, de las medianas, cuartiles inferiores, etc.).

Si hace esa suposición, puede obtener estimaciones e intervalos para los cambios relativos, al igual que con el ANOVA. Bueno, también es posible obtener intervalos sin ese supuesto, pero son más difíciles de interpretar].

Si miras la respuesta aquí En este artículo, especialmente hacia el final, se discute la comparación entre la prueba t y la de Wilcoxon-Mann-Whitney, que (cuando se hacen pruebas de dos colas al menos) son el equivalente* de ANOVA y Kruskal-Wallis aplicados a una comparación de sólo dos muestras; da un poco más de detalle, y gran parte de esa discusión se traslada a la de Kruskal-Wallis vs ANOVA.

* (aparte de un problema particular que surge con las comparaciones multigrupo en las que puede haber diferencias no transitivas entre pares)

No está del todo claro a qué te refieres con una diferencia práctica. En general, los utilizas de forma similar. Cuando se aplican ambos conjuntos de supuestos, suelen dar resultados bastante similares, pero ciertamente pueden dar valores p bastante diferentes en algunas situaciones.

Edición: He aquí un ejemplo de la similitud de la inferencia incluso con muestras pequeñas -- aquí está la región de aceptación conjunta para los cambios de ubicación entre tres grupos (el segundo y el tercero cada uno comparado con el primero) muestreados a partir de distribuciones normales (con tamaños de muestra pequeños) para un conjunto de datos particular, al nivel del 5%:

Acceptance regions for location-differences in Kruskal-Wallis and Anova

Pueden distinguirse numerosas características interesantes: en este caso, la región de aceptación del KW es ligeramente mayor, y su límite está formado por segmentos de líneas rectas verticales, horizontales y diagonales (no es difícil averiguar por qué). Las dos regiones nos dicen cosas muy parecidas sobre los parámetros que nos interesan.

2 votos

+1. Me he atrevido a editarlo ligeramente sólo para añadir énfasis donde lo creía necesario. Por favor, vea ahora, si está de acuerdo o no.

0 votos

@ttnphns gracias por la edición. Hay algunas razones particulares por las que algunas de las cosas que has cambiado estaban ahí, así que puede que vuelva a editar algo del original. Sin embargo, tal vez debería hacer más claro por qué Lo escribí como lo tenía antes. Pero primero quiero pensar detenidamente en la mejor manera de mantener la mayor cantidad de cambios que pueda.

5voto

Stat Puntos 4224

Sí, lo hay. El anova es un enfoque paramétrico mientras que kruskal.test es un enfoque no paramétrico. Así que kruskal.test no necesita ningún supuesto de distribución.
Desde el punto de vista práctico, cuando los datos están sesgados, entonces anova no sería un buen enfoque a utilizar. Echa un vistazo a esta pregunta por ejemplo.

5 votos

Yo diría que el ANOVA de Kruskal-Wallis hace suposiciones relajadas en cuanto a las distribuciones en comparación con el ANOVA paramétrico: las observaciones de cada grupo provienen de poblaciones con forma similar . La heteroscedasticidad o las distribuciones muy sesgadas siguen siendo tan problemáticas como en las pruebas tradicionales.

2 votos

¿Cómo es eso, @chl? Los rangos no se modifican por la inclinación, y KW se basa en el rango. ¿Qué me falta?

6 votos

@PeterFlom La prueba de KW supone que las poblaciones muestreadas tienen una forma y una dispersión idénticas, aunque en la mayoría de los casos una pequeña desviación de esos supuestos no afectará a los resultados. Cuando se cumplen los supuestos paramétricos, la prueba es $3/\pi$ tan potente como el ANOVA unidireccional. En lo que respecta a las estadísticas de pruebas basadas en el rango, algunos estudios sugieren, sin embargo, que los diversos grados de asimetría pueden inflar la tasa de error nominal de tipo I, véase, por ejemplo, Fagerland y Sandvik (2009) o alguna otros referencias .

4voto

Ηλίας Puntos 109

Por lo que sé (pero por favor, corregidme si me equivoco porque no estoy seguro), el test de Kruskal-Wallis se construye para detectar una diferencia entre dos distribuciones que tienen la misma forma y la misma dispersión, es decir, una se obtiene trasladando la otra por una diferencia $\Delta$ como por ejemplo: enter image description here

Llamemos a $(*)$ esta suposición. La prueba KW pone a prueba la hipótesis nula $H_0\colon\{\Delta=0\}$ vs $H_1\colon\{\Delta \neq 0\}$ . Sin embargo, la prueba de KW es "válida" sin suposición $(*)$ su nivel de significación (probabilidad de rechazar $H_0$ en $H_0)$ es válido porque $(*)$ se cumple obviamente bajo $H_0\colon\{\text{the distributions are equal}\}$ .

Pero la prueba KW es "ineficiente" si $(*)$ no se sostiene: sólo pretende tener un buen poder para detectar $\Delta >0$ y entonces el estadístico de prueba no es apropiado para reflejar la diferencia entre las dos distribuciones si no hay tal $\Delta$ .

Considere el siguiente ejemplo. Dos muestras $x$ y $y$ de tamaño $n=1000$ se generan a partir de dos distribuciones bastante diferentes pero que tienen la misma media. Entonces KW no rechaza $H_0$ .

set.seed(666)
n <- 1000
x <- rnorm(n)
y <- (2*rbinom(n,1,1/2)-1)*rnorm(n,3)
plot(density(x, from=min(y), to=max(y)))
lines(density(y), col="blue")

enter image description here

> kruskal.test(list(x,y))

    Kruskal-Wallis rank sum test

data:  list(x, y)
Kruskal-Wallis chi-squared = 2.482, df = 1, p-value = 0.1152

Como dije al principio, no estoy seguro de la construcción precisa de KW. Quizá mi respuesta sea más correcta para otra prueba no paramétrica (Mann-Whitney ), pero el enfoque debería ser similar.

1 votos

Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersion Como se menciona en la respuesta de Glen, los comentarios y en muchos otros lugares en este sitio, es cierto, pero es la lectura estrecha de lo que hace la prueba. same shape/dispersion en realidad no es un intrínseco, sino que es un supuesto adicional que se utiliza en algunas situaciones y no se utiliza en otras.

0 votos

P.D. Su segundo ejemplo no contradice ni refuta la prueba KW. La H0 de la prueba es no distributions are equal es un error pensar así. El H0 es sólo que, figuradamente, los dos puntos de "condensación de las gravedades" no se desvían el uno del otro.

0 votos

@ttnphns te creo, no sé. Pero comúnmente consideramos $H_0$ como la igualdad (véase, por ejemplo, el artículo de la wikipedia).

1voto

Zizzencs Puntos 1358

Kruskal-Wallis se basa en el rango, en lugar de en el valor. Esto puede suponer una gran diferencia si hay distribuciones sesgadas o si hay casos extremos

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X