La prueba de rango con signo de Wilcoxon tiene una distribución nula que se acerca rápidamente a una distribución normal.
Las tablas tienden a detenerse en n=50 porque la aproximación normal es excelente mucho antes de ese punto. De hecho, probablemente tenga poco sentido tabular mucho más allá de n=20. La aproximación normal se encuentra en la página de Wikipedia para la prueba, pero debes asegurarte de estar utilizando la misma versión de la estadística (hay más de una definición dando vueltas; sin embargo, todos deberían dar los mismos valores de p). La versión de Wikipedia utiliza la suma de todos los rangos con signo.
Si utilizas R (u otro número de paquetes estadísticos), te darán con gusto los valores críticos para pruebas de una y dos colas. Nuevamente, debes asegurarte de estar utilizando la misma definición de la estadística que ellos utilizan (R utiliza "la suma de los rangos positivos" como estadística).
Utilizando la definición de la estadística de R, en n=63, el valor crítico a dos colas del 5% es 1294; el valor crítico de una cola superior al 5% es 1248.
Utilizando la aproximación normal correspondiente (con o sin corrección por continuidad) se obtienen los mismos valores.
Para obtener un valor p utilizando una aproximación normal necesitas:
-
la media y la desviación estándar de la estadística particular que estás utilizando, cuando $H_0$ es verdadero. Entonces puedes (por ejemplo) calcular una versión estandarizada de la estadística de prueba (que está aproximadamente distribuida normalmente) si deseas, aunque con paquetes de computadora puedes evitar la necesidad de estandarizar.
-
Luego, puedes utilizar tablas normales o funciones de computadora para la distribución normal para obtener un valor p, o simplemente puedes comparar tu estadística con valores críticos para tu nivel de significancia.
0 votos
¿Estás trabajando en un contexto académico, empresarial o en otra cosa? Yo lo usé en un contexto empresarial donde pude ser mucho más liberal con la metodología.
0 votos
Cuando el propósito es comprender los pasos, es contraproducente (a) utilizar un conjunto de datos que requiere una computación extensa (como uno con 63 observaciones emparejadas) y (b) no tener una respuesta exacta y autoritativa disponible. ¿Por qué no usar conjuntos de datos del tamaño considerado originalmente por Frank Wilcoxon y comparar tus cálculos con los suyos?