4 votos

Prueba de significación estadística: Anova unidireccional y prueba de Kruskal-Wallis

Estaba comparando datos entre dos grupos y para cada grupo había seis muestras. Mis datos son los siguientes:

grupo 1: 103,56, 103,32, 103,32, 104,27, 103,56, 103,8

grupo 2: 97,16, 97,16, 96,69, 98,58, 90,76, 97,64

Realicé un Anova unidireccional y también la prueba de Kruskal-Wallis para ambos grupos. El valor p de Anova fue muy inferior a 0,05, lo que indica que a un nivel de significación de 0,05 había una diferencia significativa entre los conjuntos de datos de los dos grupos. El valor p de la prueba de kruskal-Wallis fue de 0,3553 (> 0,05), lo que indica que, a un nivel de significación de 0,05, no hubo diferencias significativas entre los dos conjuntos de datos de los grupos.

Agradecería que alguien me explicara por qué obtengo valores p diferentes para el mismo conjunto de datos al ejecutar estas dos pruebas.

5voto

AdamSane Puntos 1825

En general, no es necesariamente de esperar que el ANOVA unidireccional y el Kruskal-Wallis sean similares, a veces pueden dar valores p bastante diferentes. Véase aquí para una pequeña motivación parcial de por qué se puede esperar una diferencia. [Cuando las muestras tienen un aspecto razonablemente normal y las medias no están muy separadas por errores estándar, a menudo tienden a dar valores p similares. Fuera de eso, con frecuencia no lo hacen].

Sin embargo, en este caso la razón es más prosaica: su valor p de Kruskal-Wallis es incorrecto.

He aquí un resumen de los resultados en R (detalles más abajo).

                     p-value
Welch t-test:        0.001287
Equal-var. t-test:   8.552e-05
One way anova:       8.55e-05 
Wilcoxon test:       0.004847
Kruskal-Wallis:      0.003761

(Ninguno de los dos últimos valores p son exactos; si lo fueran, se obtendría el mismo valor p para la comparación de dos grupos).

Tu problema es que estás tratando los datos del segundo grupo como un factor (véase el final de esta respuesta).


Esto es lo que obtengo en R con tus datos:

frh <- data.frame(group1 = c(103.56, 103.32, 103.32, 104.27, 103.56, 103.8),
                  group2 = c( 97.16,  97.16,  96.69,  98.58,  90.76,  97.64))

# strip chart:  

enter image description here

# Welch t-test:
> with(frh,t.test(group1,group2))

    Welch Two Sample t-test

data:  group1 and group2
t = 6.3316, df = 5.163, p-value = 0.001287
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  4.368147 10.245186
sample estimates:
mean of x mean of y 
103.63833  96.33167 

$\,$

# equal-variance t-test:
> with(frh,t.test(group1,group2,var.equal=TRUE))

    Two Sample t-test

data:  group1 and group2
t = 6.3316, df = 10, p-value = 8.552e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 4.735411 9.877922
sample estimates:
mean of x mean of y 
103.63833  96.33167 

$\,$

#one way anova:
summary(aov(values~ind,stack(frh)))
            Df Sum Sq Mean Sq F value   Pr(>F)    
ind          1 160.16   160.2   40.09 8.55e-05 ***
Residuals   10  39.95     4.0 

$\,$

# Wilcoxon-Mann-Whitney:
> with(frh,wilcox.test(group1,group2))

    Wilcoxon rank sum test with continuity correction

data:  group1 and group2
W = 36, p-value = 0.004847
alternative hypothesis: true location shift is not equal to 0

Warning message:
In wilcox.test.default(group1, group2) :
  cannot compute exact p-value with ties

$\,$

# Kruskal-Wallis test:
> kruskal.test(frh)

    Kruskal-Wallis rank sum test

data:  frh
Kruskal-Wallis chi-squared = 8.3958, df = 1, p-value = 0.003761

Todos son tan coherentes entre sí como cabría esperar de esos datos.


Ahora, aquí es cómo conseguir lo que tienes para el Kruskal-Wallis:

with(frh,kruskal.test(group1,group2))

    Kruskal-Wallis rank sum test

data:  group1 and group2
Kruskal-Wallis chi-squared = 4.3939, df = 4, p-value = 0.3553

El problema es que, si te pasa esto, lo estás usando mal. Así no es como funciona la función - group2 se trata como un factor que define diferentes grupos para los datos en group1 .

Así que la razón principal por la que Kruskal Wallis no le da un valor p similar al ANOVA es que no lo ha llamado correctamente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X