2 votos

Estadística de la prueba de Wilcoxon

Aprendí WSR (Wilcoxon signed rank test) hace varios años, y hoy uno de mis amigos sugieren diferentes estadísticas de prueba en WSR. Al principio, pensé que estaba equivocado; sin embargo, encontré algunas fuentes que citaban el suma positiva de rangos como estadístico de prueba W. Como sugieren estos enlaces: http://courses.wcupa.edu/rbove/Berenson/CD-ROM%20Topics/topice-10_5.pdf http://www.stat.umn.edu/geyer/5601/notes/wilcox.pdf

Según mi estadística de estudiantes universitarios, elegimos el min(W+,W-) como estadístico de prueba, por ejemplo: http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Nonparametric/BS704_Nonparametric6.html

En wiki, se sugiere que W = abs(W+ menos W-) . https://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test#Test_procedure

¿Por qué la prueba WSR tiene tantos estadísticos de prueba "alternativos"? ¿Existen muchas versiones de la prueba WSR? ¿Cuándo utilizar qué estadísticos de prueba? Estoy confuso. Por favor, comparta conmigo cualquier idea, muchas gracias.

#

Me gustaría editar esta pregunta. Acabo de tratar de escribir funciones para calcular las puntuaciones z en r. el uso de dos ecuaciones a continuación, yo era capaz de obtener el mismo absoluto z-puntuaciones utilizando la suma negativa rango, suma positiva rango, o la suma absoluta rango:

estos datos eran réplicas de una fuente en línea https://www.youtube.com/watch?v=TqCg2tb4wJ0

n = tamaño de la muestra de clasificación no nula

w+ = 75

w- = 16

|w| = 75-16=59

n = 13

para neg o pos

z (w-(n*(n+1)/4))/(sqrt((n*(n+1)*(2*n+1)/24)))

}

para el absoluto

z (w)/sqrt((n*(n+1)*(2*n+1))/6) }

z [1] 2.061627

z [1] -2.061627

z [1] 2.061627

Pero sigo confundido con él... ¿Debería considerarse irresponsable que los artículos y documentos utilicen la suma de rangos positiva como estadística de prueba de w? Normalmente la gente utiliza la hoja de valores críticos de w para determinar el resultado, ¿verdad? http://users.stat.ufl.edu/~winner/tables/wilcox_signrank.pdf

En el caso anterior (el enlace de youtube), si utilizamos la suma de rangos positiva, el resultado sería totalmente opuesto.

Por favor, dígame si estaba pensando en la dirección correcta.

2voto

BruceET Puntos 7117

Ejemplo de pruebas de 2 muestras en R y en Minitab (software a mano en este momento):

R (simular datos falsos):

x1 = round(rnorm(30, 100, 15),2);  x2 = round(rnorm(25, 110, 15),2)
sort(x1)
 [1]  67.38  68.20  79.60  80.39  82.42  83.11  84.65  86.45  90.36  93.48  94.14
[12]  97.65  99.56 101.25 102.01 102.63 103.66 103.98 105.82 105.89 106.30 112.02
[23] 113.57 113.73 114.68 117.58 119.63 119.92 120.97 133.46
sort(x2)
 [1]  81.53  91.60  95.55 100.34 102.89 103.39 104.81 105.00 106.02 106.43 106.51
[12] 111.37 111.70 113.26 113.73 114.05 115.09 117.22 118.29 121.24 127.69 132.60
[23] 137.79 137.97 143.20

Salida

wilcox.test(x1, x2)

        Wilcoxon rank sum test with continuity correction

data:  x1 and x2
W = 218.5, p-value = 0.008366
alternative hypothesis: true location shift is not equal to 0

Warning message:
In wilcox.test.default(x1, x2) : cannot compute exact p-value with ties

Minitab (introducción de los mismos datos utilizados en R):

MTB > set c1
DATA>   67.38  68.20  79.60  80.39  82.42  83.11  84.65  86.45  90.36  93.48  94.14
DATA>   97.65  99.56 101.25 102.01 102.63 103.66 103.98 105.82 105.89 106.30 112.02
DATA>  113.57 113.73 114.68 117.58 119.63 119.92 120.97 133.46
DATA> end
MTB > set c2
DATA>   81.53  91.60  95.55 100.34 102.89 103.39 104.81 105.00 106.02 106.43 106.51
DATA>  111.37 111.70 113.26 113.73 114.05 115.09 117.22 118.29 121.24 127.69 132.60
DATA>  137.79 137.97 143.20
DATA> end
MTB > Mann-Whitney C1 C2;
SUBC>   Alternative 0.

Salida

Mann-Whitney Test: C1, C2 

     N  Median
C1  30  102.32
C2  25  111.70

Point estimate for η1 - η2 is -11.57
W = 683.5
Test of η1 = η2 vs η1 ≠ η2 is significant at 0.0084
The test is significant at 0.0084 (adjusted for ties)

Observe que los "estadísticos W" difieren, pero los valores P son 0,0084 en ambos paquetes de software. La observación 113.73 ocurre en ambas muestras. Esto causa pequeñas dificultades con la teoría de la distribución que los dos programas tratan de forma ligeramente diferente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X