14 votos

¿Cómo se informa de una prueba de Mann-Whitney?

Estoy haciendo mi tesis doctoral y estoy realizando una serie de pruebas. Después de utilizar una prueba de Kruskal-Wallis, suelo informar del resultado así:

Hay una diferencia significativa $(\chi^2_{(2)}=7.448, p=.024)$ entre los medios de...

Pero ahora he realizado una prueba de Mann-Whitney, y no estoy seguro de qué valores presentar. SPSS me da un Mann-Whitney $U$ , Wilcoxon $W$ , $Z$ y $P$ -valor. ¿Presento todos estos 4 valores? ¿O algunos son irrelevantes?

13voto

Nick Stauner Puntos 8220

Wikipedia parece tener sus respuestas. He aquí un extracto del ejemplo de declaración de resultados:

Al informar de los resultados de una prueba de Mann-Whitney, es importante indicar:

  • Una medida de las tendencias centrales de los dos grupos (medias o medianas; dado que el Mann-Whitney es una prueba ordinal, se suelen recomendar las medianas)
  • El valor de U
  • El tamaño de las muestras
  • El nivel de significación.

En la práctica, es posible que parte de esta información ya se haya suministrado y se debe utilizar el sentido común para decidir si se repite. Un informe típico podría ser,

"Las medianas de las latencias en los grupos E y C fueron de 153 y 247 ms; las distribuciones en los dos grupos difirieron significativamente (Mann-Whitney U \= 10.5, n 1 \= n 2 \= 8, P < 0,05 de dos colas)".

El Prueba de rango con signo de Wilcoxon es apropiado para muestras emparejadas, mientras que la prueba de Mann-Whitney supone muestras independientes. Sin embargo, según Campo (2000) , el Wilcoxon $W$ en su salida del SPSS es "una versión diferente versión de este estadístico, que puede convertirse en una puntuación Z y puede, por tanto, compararse con los valores críticos de la distribución normal". Eso explica su $z$ ¡también anotar entonces!

PARA SU INFORMACIÓN, Wikipedia añade que, para las muestras grandes, $U$ tiene una distribución aproximadamente normal. Dados todos estos valores, también se puede calcular el tamaño del efecto $η^2$ que, en el caso del ejemplo de Wikipedia, es de 0,319 (en la sección 11 se aplica una calculadora aquí ). Sin embargo, esta transformación de la estadística de la prueba depende de la normalidad aproximada de $U$ por lo que podría ser inexacto con n s = 8 ( Fritz y otros, 2012 ) .

P.D. Los resultados de la prueba de Kruskal-Wallis no deben interpretarse como reveladores de diferencias entre medias, salvo en circunstancias especiales. Véase el artículo de @Glen_b respuesta a otra pregunta, "Diferencia entre el ANOVA y la prueba de Kruskal-Wallis" para más detalles.

Referencias

Field, A. (2000). 3.1. Prueba de Mann-Whitney. Métodos de investigación 1: SPSS para Windows parte 3: Pruebas no paramétricas. Extraído de http://www.statisticshell.com/docs/nonparametric.pdf .
Fritz, C. O., Morris, P. E., & Richler, J. J. (2012). Estimaciones del tamaño del efecto: uso actual, cálculos e interpretación. Revista de Psicología Experimental: General , 141 (1), 2-18. PDF disponible en ResearchGate .

3 votos

¿Qué sentido tiene informar del valor de U en el ejemplo anterior? ¿Qué gano yo, como lector, al saber que U era 10,5?

4 votos

En el ejemplo anterior, se obtiene la capacidad de calcular el $p$ que no se da y que puede ser útil para la estimación del tamaño del efecto, el meta-análisis o la comprobación de $p$ -hacking. Un amigo y colega mío @rpierce también me ha aconsejado que informe de las estadísticas de las pruebas para asegurar a los lectores que estoy haciendo las cosas bien en general, ya que ha pillado muchos artículos publicados haciéndolo mal a través de las estadísticas de las pruebas mal comunicadas y las $df$ .

0 votos

Interesante. Supongo que esta cuestión podría merecer una pregunta aparte, que podría plantear aquí en algún momento. De todos modos, si uno quiere valores p exactos, ¡puede informar de los valores p exactos! De hecho, el consejo habitual es informar de los valores p exactos, a menos que sean muy pequeños, como p<0,0001; pero en este caso es poco probable que se produzca un p-hacking. Y el tamaño del efecto debería informarse por separado de todos modos, como, por ejemplo, "las latencias medias en los grupos E y C fueron de 153 y 247 ms" en su cita de la wiki.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X