9 votos

¿Está mal la inquietud antes de realizar la prueba de Wilcoxon?

Escribí un guión de pruebas los datos utilizando el wilcox.test, pero cuando me dieron los resultados, todos los p-valores donde igual a 1. He leído en algunos sitios web que usted podría utilizar el jitter antes de la prueba de los datos (para evitar empates como se dijo), yo hice esto y ahora tengo un resultado aceptable. Es malo hacer esto?

test<- function(column,datacol){
    library(ggplot2)
t=read.table("data.txt", stringsAsFactors=FALSE)
uni=unique(c(t$V9))
    for (xp in uni) { 
          for(yp in uni) {
            testx <- subset(t, V9==xp)
            testy <- subset(t, V9==yp)
            zz <- wilcox.test(testx[[datacol]],jitter(testy[[datacol]]))
            p.value <- zz$p.value
          }
        }
}


Este es el resultado de dput(head(t))

structure(list(V1 = c(0.268912,
0.314681, 0.347078, 0.286945, 
0.39562, 0.282182), V2 = c(0.158921, 0.210526, 0.262024, 0.322006, 
0.133417, 0.283025), V3 = c(0.214082, 0.166895, 0.132547, 0.147361, 
0.09174, 0.169093), V4 = c(0.358085, 0.307898, 0.258352, 0.243688, 
0.379224, 0.2657), V5= c(-0.142223, 0.010895, 0.14655, 
0.08152, 0.02116, 0.030083), V6 = c(0.096408, -0.091896,

-0.331229, -0.446603, -0.088493, -0.262037), V7` = c(1.680946, 
1.649559, 1.534401, 1.130529, 3.441356, 1.211815), V8 = c("NC_000834",  "NC_000844",
"NC_000845", "NC_000846", "NC_000857",
"NC_000860" ), V9 = c("Chordata",
"Arthropoda", "Chordata", "Chordata", 
"Arthropoda", "Chordata"), V10 =
c("???:???", "Diplostraca", 
"???:???", "Rheiformes", "Diptera",
"Salmoniformes"), V11 = c("???:???",
"Branchiopoda", "Mammalia", "Aves",
"Insecta", "Actinopterygii" )), .Names
= c("V1", "V2", "V3", "V4", "V5", "V6",  "V7",
"V8", "V9", "V10",
"V11"), row.names = c(NA,  6L),
class = "data.frame")

Los datos es muy grande, y ese es el hilo que empecé y me dijeron que podría estar equivocado, para ello

Nota Esta pregunta viene de tex.SE: la generación de PDFcontain salida R en el interior de látex tabla

7voto

Raptrex Puntos 115

Hay un hilo en el R-help lista acerca de esto, véase, por ejemplo: http://tolstoy.newcastle.edu.au/R/e8/help/09/12/9200.html

La primera sugerencia de que hay que repetir la prueba de un gran número de veces con diferentes parpadee y, a continuación, combinar los p-valores para obtener un total p-valor, ya sea tomando un promedio o un máximo. También sugieren que una simple prueba de permutación podría ser utilizado en lugar (de los dos, que es lo que prefiero). Vea la pregunta Que permutación de prueba de implementación en R para usar en lugar de la prueba t (pareadas y no pareadas)? para algunos ejemplos de pruebas de permutación.

En otro lugar en ese hilo, Greg Nieve escribe: La adición de ruido aleatorio a los datos con el fin de evitar una advertencia como la eliminación de las baterías del detector de humo para silenciar a los que en lugar de investigar el cuál es la causa de que suene la alarma. (Ver http://tolstoy.newcastle.edu.au/R/e8/help/09/12/9195.html )

4voto

Anthony Cramp Puntos 126

(descargo de responsabilidad: yo no comprobar el código, mi respuesta es solo con base en la descripción)

Tengo la sensación de que lo que quiero hacer es una idea realmente mala. De Wilcoxon es un remuestreo (o de la aleatorización) prueba de los rangos. Es decir, se toma el rango de los valores y compara estas filas para todas las permutaciones posibles de las filas (ver por ejemplo, aquí).

Así que, como se dieron cuenta, los lazos son bastante malos como usted no recibe los rangos de ellos. Sin embargo, la adición de ruido aleatorio (jitter) a que sus datos van a transformar todos los rangos, por lo que tienen al azar filas! Es decir, distorsiona los datos severamente.

Por lo tanto: es un error hacerlo.

3voto

Zizzencs Puntos 1358

Ha pedido a varias personas lo que debe hacer ahora. En mi opinión, ahora lo que debes hacer es aceptar que el valor de p de apropiada aquí es de 1.000. Sus grupos no son diferentes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X