Quiero verificar el uso de bootstrap planteamiento de la hipótesis acerca de la falta de efecto de la intervención dentro de un grupo de seis pacientes: pre-(X) post(S) de intervención de medición. Mis datos
ID X Y
1 9.856 8.992
2 19.512 4.573
3 1.936 1.572
4 14.575 1.529
5 8.476 12.000
6 1.862 1.417
Dentro de R (2.15.1) He escrito el siguiente código, utilizando la prueba de t para datos apareados, que se basa en remuestreada pares:
boot.p.value <- function(data, S)
{
boot.t.stat <- as.numeric()
t.stat <- t.test(x=data[,1], y=data[,2], paired=TRUE)$statistic
for(s in 1:S)
{
boot.data <- data[sample(1:nrow(data), replace=TRUE),] ## resample pairs
boot.t.stat[s] <- t.test(x=boot.data[,1],y=boot.data[,2], paired=TRUE)$statistic
}
p.value <- sum(1*(boot.t.stat >= t.stat))/S
return(p.value)
}
Donde:
el arranque.p.valor(datos, S=1000) [1] 0.518
Cuando se repite el resultado de p-valores los valores se mantengan entre .4 y .6.
Para el mismo conjunto de datos en el programa SPSS ver. 19 para los pares de muestras de la prueba t ofrece bootstrap basado p = 0.182, para 1000 cambia la resolución. ¿Por qué esta diferencia?