Esto es menos una respuesta y más una solicitud de aclaración por parte de los encuestados, y quizás una aclaración en sí misma.
A continuación se presentan un par de ejemplos de libros de texto que muestran cómo se maneja a veces el supuesto de simetría para la prueba de rango con signo. En mi estantería no pude encontrar nada más claro ni más explicativo.
También hay numerosos ejemplos de Internet y de Cross Validated en los que la suposición de simetría se establece simplemente y sin más explicaciones.
La prueba de Wilcoxon [signed-rank] asume que la población muestreada es simétrica (en cuyo caso la mediana y la media son idénticas y este procedimiento se convierte en una prueba de hipótesis sobre la media y sobre la la mediana, pero la prueba t de una muestra suele ser una prueba más potente prueba sobre la media).
-- Zar, Bioestadística, 5º, 2010, § 7.9
.
La diferencia importante entre la prueba de signos y esta [Wilcoxon signed-rank] es un supuesto adicional de simetría de la distribución de las diferencias.
...
Supuestos:
- La distribución de cada Di [diferencia de observaciones pareadas] es simétrica.
- Los Dis son independientes entre sí.
- Los Dis tienen todos la misma media.
- La escala de medición del Dis es al menos de intervalo.
-- Conover, Practical Nonparametric Statistics, 3rd, 1999, § 5.7
Sin embargo, creo que las respuestas de @jbowman y @Glen_b explican esta suposición bajo una luz diferente.
Si el nulo es falso, no se requiere necesariamente la simetría.
...
En algunos casos puede ser conveniente asumir una alternativa de cambio de ubicación... Sin embargo, eso no lo convierte en una suposición de la prueba, sino en una suposición adicional que hemos hecho por otras razones.
-- @Glen_b
.
La prueba de rango con signo de Wilcoxon requiere que las diferencias emparejadas provengan de una distribución simétrica continua (bajo la hipótesis nula, como señala Michael Chernick en los comentarios).
-- @jbowman
Una forma de resumir mi entendimiento es la siguiente. La hipótesis nula para la prueba de rango con signo es que las diferencias están distribuidas simétricamente en torno a un valor. Hay dos maneras de que esta hipótesis sea errónea. 1) Las diferencias podrían ser simétricas respecto a un valor diferente. 2) Las diferencias podrían no ser simétricas. Si es el caso #1, entonces las diferencias tienen una ubicación diferente a la de la hipótesis nula, lo cual es un resultado útil y fácil de interpretar. Si es el caso #2, entonces los datos están sesgados de una manera que es un resultado útil. Esto puede ser un poco menos fácil de interpretar que en #1, pero un examen de un histograma de las diferencias debería revelar información útil sobre la distribución.
Con este entendimiento, creo que no hay ninguna suposición sobre la distribución de los datos originales, las diferencias o los rangos de las diferencias.
¿Qué te parece esto?