Generalmente se atribuye a Wilcoxon la invención original de la prueba*, aunque el enfoque de Mann y Whitney supuso un gran avance y amplió los casos para los que se tabulaba la estadística. Mi preferencia es referirme a la prueba como Wilcoxon-Mann-Whitney, para reconocer ambas contribuciones (también se ve Mann-Whitney-Wilcoxon; tampoco me importa).
* Sin embargo, el panorama real es un poco más turbio, ya que varios otros autores también presentaron estadísticas iguales o similares sobre esta época o antes, o en algunos casos hicieron contribuciones que están estrechamente relacionadas con la prueba. Al menos parte del mérito debería corresponder a otros autores.
La prueba de Wilcoxon y la prueba U de Mann-Whitney son equivalentes (y la ayuda afirma que lo son) en el sentido de que siempre rechazan los mismos casos en las mismas circunstancias; como mucho, sus estadísticos de prueba sólo diferirán por un desplazamiento (y en algunos casos, sólo posiblemente un cambio de signo).
La prueba de Wilcoxon se define de más de una forma en la bibliografía (y esa ambigüedad se remonta a la tabulación original de la estadística de prueba, de la que hablaremos más adelante), por lo que hay que tener cuidado con la prueba de Wilcoxon de la que se habla.
En este par de entradas se analizan las dos formas más comunes de definición:
Prueba de suma de rangos de Wilcoxon en R
Diferentes formas de calcular el estadístico de la prueba de suma de rangos de Wilcoxon
Para abordar lo que, específicamente, sucede en R:
La estadística utilizada por wilcox.test
en R se define en la ayuda ( ?wilcox.test
), y la cuestión de la relación con la estadística U de Mann-Whitney se explica allí:
Las definiciones de las pruebas de suma de rangos de Wilcoxon y Mann-Whitney no son unánimes en la bibliografía.
Las dos definiciones más comunes corresponden a la suma de los rangos de la primera muestra con el valor mínimo restado o no: R resta y S-PLUS no, lo que da un valor que es mayor en m(m+1)/2 para una primera muestra de tamaño m. (Parece que el documento original de Wilcoxon utilizaba la suma de los rangos sin ajustar, pero las tablas posteriores restaban el mínimo).
El valor de R también puede calcularse como el número de todos los pares (x[i], y[j])
para lo cual y[j]
no es mayor que x[i]
la definición más común de la prueba de Mann-Whitney.
Esta última frase responde completamente a ese aspecto de tu pregunta: la versión de W que saca R* es también el valor de U.
* La suma de los rangos de la muestra 1, menos el valor más pequeño que pueda tomar (es decir, menos $\frac{n_1(n_1+1)}{2}$ ).