(Tira Conover [1] fuera de la biblioteca...)
Esta idea es muy antigua; se remonta al menos a van der Waerden (1952/1953) [2][3], quien sugirió una prueba que corresponde a la prueba de Kruskal Wallis, pero con rangos reemplazado por una puntuación normal. (La idea de utilizar ordenó al azar de los valores normales en lugar de una aproximación de sus expectativas o su mediana es tal vez incluso un poco más.)
De acuerdo a Conover, Fisher y Yates (1957) [4] sugieren que la sustitución de las observaciones con las expectativas de resultados normales (es decir, transformado filas) en una variedad de pruebas donde la normalidad se supone.
La asintótico de la eficiencia relativa en el normal 1, el que la hace sonar muy atractivo ... sin embargo, la ventaja más dicen que el de Wilcoxon-Mann-Whitney (ganancia en el poder), incluso a la normal, es bastante pequeña, y si la distribución es más pesado de cola de lo normal (digamos de logística), que puede ser perjudicial para ello. (Algunas de simulación sugiere que es de hecho el caso: a menos que la distribución es casi normal ya-en cuyo caso no hay ningún beneficio en hacer la transformación-una transformación de la realidad puede perder el poder.)
Chernoff & Lehmann [5] calcular asintótica de energía para una variedad de distribuciones; donde hay al menos una cola muy corta (como el uniforme), los resultados normales de la prueba puede tener mucho mejor para un cambio de alternativa contra la de Wilcoxon-Mann-Whitney, mejor que el t-test de sí mismo. Sus resultados están de acuerdo con mi simulaciones para más pesado de cola de los casos.
Tenga en cuenta que en el caso del ejemplo, como la separación en medio se convierte en grande, mientras que el combinado de la muestra se ve bastante normal, las dos muestras no son normales en todos:
Como resultado, no todas las propiedades de la normal de prueba se extenderá a los resultados normales de la prueba, y el comportamiento de la mayor de las separaciones (con muestras pequeñas) puede ser poco intuitivo.
Las pruebas obtenidas por medio de esta idea son a veces llamados colectivamente normal de las puntuaciones de las pruebas, que el término de búsqueda (a través de Google, por ejemplo) convierte un número de referencias.
Por ejemplo, aquí, Richard Darlington discute hacerlo por el de Wilcoxon signed ranks test; él señala que hay una ventaja sobre la llanura de la prueba de rango, ya que reduce el número de atados los valores de la prueba estadística.
Antes de terminar de escribir las páginas, voy a salir a buscar más.
Conover enumera una serie de referencias y tiene un poco justo de discusión, por lo que sin duda recomiendo la lectura de ese.
Gelman punto, sin embargo, parece ser acerca de la conveniencia - no necesidad de desarrollar una nueva prueba cada vez que cambia la situación; aunque si la comodidad es el principal problema ya existe la capacidad para utilizar pruebas de permutación en cualquier estadística que nos gusta. [Con el normal de las puntuaciones de enfoque, la dificultad es que todavía necesitan un medio adecuado para el rango -- usted no puede apenas rango de cosas que no son comparables bajo el null y esperar el derecho tipo de comportamiento. Hay un problema similar con la prueba de permutación, ya que de igual manera la necesidad intercambiabilidad, bajo el null.]
Usted menciona una función de R, pero usted puede clasificar y convertir a la normalidad de las puntuaciones fácilmente en R usando sólo las funciones que ya vienen con R.
por ejemplo, el uso de la sleep
datos en R. te gustaría hacer un t-test de esta manera:
t.test(extra ~ group, data = sleep) # Welch
t.test(extra ~ group, data = sleep, var.equal=TRUE) # equal-variance
t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep) # normal scores
[1] Conover, W. J. (1980),
Práctica Nonparameteric Estadísticas, 2e.
Wiley. p 316-327.
(Desde el anterior enlace de Wikipedia se ve en el 3e (1999), la discusión comienza en p396)
[2] van der Waerden, B. L. (1952),
"El fin de las pruebas para dos muestras problema y su poder",
Actas de la Koninklijke Nederlandse Akademie van Wetenschappen, de la Serie a 55 (Indagationes Mathematicae 14), 453-458.
[3] van der Waerden, B. L. (1953),
"El fin de las pruebas para dos muestras problema. II, III",
Actas de la Koninklijke Nederlandse Akademie van Wetenschappen, Serie 56 (Indagationes Mathematicae, 15), 303-310 & 311-316.
(también hay correcciones a la de 1952 papel en la página 80 de que el volumen)
[4] R. A. Fisher y Yates, F. (1957)
Tablas estadísticas Biológica, Agrícola y de la Investigación Médica, 5e, Oliver & Boyd, de Edimburgo.
[5] Hodges, J. L.; Lehmann, E. L. (1961),
"Comparación de la Normal de las Puntuaciones de Wilcoxon y Pruebas"
Actas del iv Simposio de Berkeley Matemático de la Estadística y la Probabilidad, Volumen 1: Contribuciones a la Teoría de las Estadísticas, 307--317,
University of California Press, Berkeley, California.
http://projecteuclid.org/euclid.bsmsp/1200512171.