La prueba de rango con signo de Wilcoxon tiene una distribución nula que se aproxima rápidamente a una distribución normal.
Las tablas tienden a detenerse en n=50 porque la aproximación normal es excelente mucho antes de ese punto. De hecho, probablemente no tenga mucho sentido tabular más allá de n=20. La aproximación normal se da en la página de Wikipedia para la prueba, pero hay que asegurarse de que se está utilizando la misma versión de la estadística (hay más de una definición circulando; sin embargo, todas deberían dar los mismos valores p). La versión de Wikipedia utiliza la suma de todos los rangos con signo.
Si utiliza R (u otros paquetes estadísticos), le proporcionarán valores críticos para pruebas de una y dos colas. De nuevo, tienes que asegurarte de que utilizas la misma definición de estadística que ellos (R utiliza "la suma de los rangos positivos" como estadística).
Utilizando la definición de R de la estadística, en n=63, el valor crítico de dos colas del 5% es 1294; el valor crítico de una cola (superior) del 5% es 1248.
Utilizando la aproximación normal correspondiente (con o sin corrección de continuidad) se obtienen los mismos valores.
Para obtener un valor p utilizando una aproximación normal necesitas:
-
la media y la desviación estándar de la estadística concreta que está utilizando, cuando $H_0$ es cierto. Si lo desea, puede (por ejemplo) calcular una versión estandarizada de la estadística de la prueba (que tiene una distribución aproximadamente normal), aunque con los paquetes informáticos puede evitar la necesidad de estandarizar.
-
A continuación, puede utilizar tablas normales o funciones informáticas para la distribución normal con el fin de obtener un valor p, o simplemente puede comparar su estadística con los valores críticos para su nivel de significación.
0 votos
¿Trabaja en un contexto académico, empresarial o de otro tipo? Utilicé N<10 en un contexto empresarial en el que podía ser mucho más liberal con la metodología.
0 votos
Cuando el propósito es comprender los pasos, es contraproducente (a) utilizar un conjunto de datos que requiera un cálculo exhaustivo (como ocurre con uno con 63 observaciones emparejadas) y (b) no disponer de una respuesta exacta y autorizada. ¿Por qué no utilizar conjuntos de datos del tamaño considerado originalmente por Frank Wilcoxon y comparar tus cálculos con los suyos?