5 votos

Salida de la prueba de rango de signo de Wilcoxon de una cola en R

Estoy tratando de evaluar la diferencia entre los dos algoritmos. Ellos son estocásticos, así que me he quedado varias veces en contra de los mismos archivos de entrada y tomó nota de sus resultados. Quiero saber si mi algoritmo ofrece una mejora estadísticamente significativa de más de un enfoque anterior. De mi (potencialmente defectuoso) la comprensión de este tipo de situaciones es donde debería (o más bien podría) utilizar el Signo de Wilcoxon Rank.

Los datos son naturalmente vinculado, así que pueden unirse salidas de ambos algoritmos de la entrada en particular problema. Ya quiero probar que mi algoritmo es no sólo diferente, pero en realidad es mejor (en este caso devolver valores más bajos) que los otros algoritmo esto parece ser una cola de asunción.

Estoy usando el R wilcox.test función para realizar la prueba y estoy un poco confundido acerca de cómo debería interpretar los resultados. He leído la página de ayuda para wilcox.test y no parece ofrecer mucha información acerca de los resultados, más énfasis se hace a los argumentos de la función. He hecho un mínimo ejemplo de trabajo con un pequeño subconjunto de mis datos:

x <- structure(list(instance = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L), .Label = c("competition01", "competition02", 
"competition03", "competition04", "competition05", "competition06", 
"competition07", "competition08", "competition09", "competition10", 
"competition11", "competition12", "competition13", "competition14", 
"competition15", "competition16", "competition17", "competition18", 
"competition19", "competition20"), class = "factor"), nhoods = structure(c(1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), .Label = c("nhoods1", "nhoods2", 
"nhoods3", "nhoods4", "nhoods5"), class = "factor"), run.no = structure(c(1L, 
1L, 2L, 2L, 3L, 3L, 4L, 4L, 5L, 5L), .Label = c("1", "2", "3", 
"4", "5"), class = "factor"), partition = structure(c(1L, 2L, 
1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L), .Label = c("Hard-Soft", "Full"
), class = "factor"), VNS = c(984L, 1445L, 1033L, 1445L, 1035L, 
1318L, 1058L, 1445L, 913L, 1445L), `VNS-Skip` = c(1083L, 1425L, 
1099L, 1230L, 1077L, 1363L, 1102L, 1442L, 1093L, 1252L)), .Names = c("instance", 
"nhoods", "run.no", "partition", "VNS", "VNS-Skip"), row.names = c(NA, 
10L), class = "data.frame")

wilcox.test(x[,5], x[,6], paired = TRUE, conf.int = TRUE, alternative = "greater")

Mi algoritmo de resultados en la 6ª columna y los originales están en la 5ª columna. Ya quiero para evaluar si mi algoritmo es mejor que yo he utilizado la alternativa = "mayor" opción, la cual debe significar que la prueba es la comprobación de la 1ª arg > del 2 de arg.

Esto se traduce en la salida:

  Wilcoxon signed rank test

  data:  x[, 5] and x[, 6] 
  V = 22, p-value = 0.7217
  alternative hypothesis: true location shift is greater than 0 
  95 percent confidence interval:
  -72 Inf 
  sample estimates:
  (pseudo)median 
        -21 

En este caso el p-valor no es menor que 0.05 por lo que no hay suficiente evidencia para descartar la hipótesis nula.

Lo que hace tener infinito como el límite superior de un intervalo de confianza de decir? Es esto porque estoy usando el de una cola de la versión de prueba? Todas las pruebas que me he encontrado en mis datos siempre tienen la parte superior del intervalo de confianza como Inf. Si el p-valor inferior a 0,05 tendría que decir yo estaría justificado diciendo: "con un 95% de confianza x[,5]'s significa que será dentro de -72 de x[,6]'s?"

¿Qué hace el V valor de la media con respecto a mis datos? Por lo que puedo ver es la diferencia entre median(x[,5]) y median(x[,6] , pero ¿cómo podría describir en prosa? ¿Alguien realmente utilizar el valor V es la discusión de sus análisis de datos?

6voto

AdamSane Puntos 1825

Lo que hace tener infinito como el límite superior de un intervalo de confianza de decir? Es esto porque estoy usando el de una cola de la versión de prueba?

Sí, es porque estás haciendo una cola versión de la prueba; no importa lo lejos la ubicación de ejemplo en el "equivocado" de la dirección (es decir, la dirección incompatible con la alternativa), siendo coherente con el null - así que usted está considerando sólo una cara límites.

¿eso significa que yo estaría justificado diciendo: "con un 95% de confianza x[,5]'s significa que será dentro de -72 de x[,6]'s?"

No, eso no lo justifica esa afirmación. Para empezar no vas a probar significa en absoluto a menos que usted haga algunas suposiciones adicionales que hacen la diferencia en los medios coinciden con los de la población equivalente de la ubicación de cambio de estimación para la prueba.

En segundo lugar, la ubicación de diferencia podría estar en el "equivocado" de la dirección, para que 'dentro de' no acaba de funcionar bien.

En tercer lugar, dos lugares normalmente no son considerados 'dentro de' un negativo de distancia el uno del otro.

Usted podría decir algo como "la estimación de la mejora de la primera a la segunda algoritmo fue de 21" (y, a continuación, dar a las unidades!). Nota que dije de 21 años y 72. Si usted explicar al lector lo que el pseudo-mediana de las diferencias es, puede dar más detalles sobre lo que esta diferencia es la medición.

¿Qué hace el V valor de la media con respecto a mis datos?

Es el valor de la firma Clasificación estadística. Verificación de las referencias que se mencionan a continuación para saber cómo se calcula (en particular Hollander Y Wolfe si usted lo puede encontrar, ya que las referencias dadas en la R de ayuda, por lo que la estadística es seguro que corresponden).

En concreto, las dos principales definiciones que he visto que todos firmaron filas se agregan (esta es la versión en la página de la Wikipedia), O que sólo lo positivo firmado filas se agregan. Se parece a R utiliza el segundo. Es decir, si $x$$y$, son los dos pares de muestras, por lo que las diferencias $x-y$ son probados, entonces

 sum(rank(abs(x-y))[x>y])

debe dar la misma estadística como R. Así:

> sum(rank(abs(x[,5]-x[,6]))[x[,5]>x[,6]])
[1] 22

Por lo que puedo ver es la diferencia entre la mediana(x[,5]) y la mediana(x[,6]

No, no. Así, ellos podrían coincidir en ocasiones (como en tu ejemplo) pero eso no es lo que está pasando. Usted probablemente debería empezar por leer acerca de cómo la estadística de obras. Te sugiero algo como Conover la Práctica Estadísticas no paramétricas. O, idealmente, se puede comprobar la firma del Rango de referencia de la Prueba en el R ayuda en wilcox.test (Hollander Y Wolfe).

El valor real de la estadística no es por lo general de interés. La estimación de la magnitud de la ubicación de cambio sería relevante (y no dependen de la definición de la estadística se utiliza). Es decir, el hecho de que 0 está dentro del intervalo importa mucho, la "-21" un poco las cuestiones, la "-72" podría materia, el "22" probablemente no (aunque hay un poco de daño en citarlo si la definición de la estadística es clara para el lector).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X