Esto se desprende en gran medida de la respuesta de Antoni.
Esto es lo que pretendía con una prueba de permutación Primero excluyamos el empate como hizo Antoni:
d s r
10 1 6
-9 -1 5
8 1 4
5 1 2
-6 -1 3
0 NA NA
2 1 1
Nuestra estadística de prueba es entonces 1+2+4+6 = 13
Por lo tanto, podríamos calcular la distribución de permutación desde cero de la siguiente manera:
pm <- c(-1,1)
sign <- expand.grid(s1=pm,s2=pm,s3=pm,s4=pm,s5=pm,s6=pm)
table(rowSums((sign>0)%*%cbind(1:6)))/64
que da los mismos valores que dsignrank(0:21,6)
(¡yay!). Así que, claramente, cuando no hay empates (que es el caso, ya que los excluimos) esto es sólo la prueba de rango con signo, como debe ser
Consideremos si podemos hacer algo con el empate. El modo en que lo tratemos depende de cómo se haya producido.
Si, por ejemplo, imaginamos una escala continua subyacente que se ha discretizado en categorías, entonces nuestro empate se debe simplemente a dos valores diferentes que nuestras categorías impuestas posteriormente no son lo suficientemente finas para distinguir.
Podría decirse entonces que los dos valores son "realmente" diferentes, pero no tenemos ninguna base para concluir qué signo debemos tener y, por lo tanto, permitir ambas posibilidades, la mitad de las veces dándole un +1 y la otra mitad dándole un -1 y luego promediando los dos (o tal vez para ser conservadores, algunos argumentarían que deberíamos tomar el mayor de los dos posibles recuentos ... pero voy a seguir mirando el promedio de los dos casos posibles aquí). [Por el contrario, si los valores fueran intrínsecamente discretos sin una escala continua subyacente pero no observada, entonces diríamos que el 0 es inherente y lo trataríamos de otra manera - creo que la exclusión probablemente tiene más sentido en ese caso].
La corbata de la nota siempre tienen el rango más pequeño.
Así que tenemos una tabla como la anterior pero la penúltima fila es
d s r
: : :
0 -1 1
o
d s r
: : :
0 1 1
y todas las demás filas tendrían r
uno más alto que antes.
d s r
10 1 7
-9 -1 6
8 1 5
5 1 3
-6 -1 4
0 ±1 1
2 1 2
Así que las posibles estadísticas de la prueba son 2+3+5+7 y 1+2+3+5+7 (17 y 18)
[Un enfoque alternativo, si somos conservadores, sería tratarlo como un n=7 completo y tomar el mayor de los dos valores p posibles, lo que da 0,6875].
Si hacemos todas las permutaciones pero siempre promediando los dos signos para el rango más pequeño, contribuirán 1/2, y cada uno de los otros rangos positivos será 1 más alto.
En efecto, estaríamos haciendo esto:
table(0.5+rowSums((sign>0)%*%cbind(2:7)))/64
Y comparando una estadística de prueba de 17,5 con eso. Esto da p = 0,625.
De todos modos, todos los enfoques son un poco diferentes, pero cuentan más o menos la misma historia general aquí.
3 votos
Esto se explica en la ayuda de esta función, en
Details
: $\:$ Si sólo se da "x", o si se dan tanto "x" como "y" y "emparejado" es "VERDADERO", se realiza una prueba de rango con signo de Wilcoxon de la nulidad de que la distribución de "x" (en el caso de una muestra) o de "x - y" (en el caso de dos muestras emparejadas) es simétrica respecto a "mu".0 votos
@Glen_b
wilcox.test.default(x, mu = 0, exact = T) : cannot compute exact p-value with ties
Dado que mi conjunto de datos tiene empates, ¿significa esto que los empates no serán procesados, entonces el valor P no es exacto? He consultado la página de ayuda dewilcox.test
Parece que no puede lidiar con los lazos.1 votos
Algunas personas condicionan su inferencia a los valores no vinculados. Personalmente, me inclinaría por mantener todos los empates (que siempre contribuirán con 0) y simplemente hacer una prueba de permutación directa.
0 votos
Considere la posibilidad de aceptar la respuesta de Glen_b haciendo clic en la marca de verificación al lado de la respuesta.