4 votos

¿Por qué mi bootstrap función para muestras pareadas, la prueba t en R no devuelve el mismo resultado que el SPSS?

Quiero verificar el uso de bootstrap planteamiento de la hipótesis acerca de la falta de efecto de la intervención dentro de un grupo de seis pacientes: pre-(X) post(S) de intervención de medición. Mis datos

ID      X      Y
1  9.856  8.992
2 19.512  4.573
3  1.936  1.572
4 14.575  1.529
5  8.476 12.000
6  1.862  1.417

Dentro de R (2.15.1) He escrito el siguiente código, utilizando la prueba de t para datos apareados, que se basa en remuestreada pares:

boot.p.value <- function(data, S)
{
    boot.t.stat <- as.numeric()
    t.stat <- t.test(x=data[,1], y=data[,2], paired=TRUE)$statistic
        for(s in 1:S)
        {
            boot.data <- data[sample(1:nrow(data), replace=TRUE),] ## resample pairs
            boot.t.stat[s] <- t.test(x=boot.data[,1],y=boot.data[,2], paired=TRUE)$statistic
    }
    p.value <- sum(1*(boot.t.stat >= t.stat))/S
    return(p.value)
}

Donde:

el arranque.p.valor(datos, S=1000) [1] 0.518

Cuando se repite el resultado de p-valores los valores se mantengan entre .4 y .6.

Para el mismo conjunto de datos en el programa SPSS ver. 19 para los pares de muestras de la prueba t ofrece bootstrap basado p = 0.182, para 1000 cambia la resolución. ¿Por qué esta diferencia?

2voto

Runcible Puntos 539

El arranque de la función no es correcto.

Yo sé por qué todos los de su p valores de entre 0.4 y 0.6 y son un promedio de 0.5: la mitad de su remuestrea a dar una prueba estadística de abajo y la mitad de su remuestrea darle un estadístico de prueba por encima de la original. Usted conseguirá siempre que el resultado de esa función - he probado con algunos otros datos. No cambia aleatoriamente el pre y post de los datos.

Para obtener la secuencia de arranque valor de p, se compara su observó estadístico de prueba,

 t.test(x=data[,1], y=data[,2], paired=TRUE)$statistic 

con una muestra aleatoria de ruido de pre y post de los datos. Por lo tanto, necesita de la muestra a partir de los datos originales Y de forma aleatoria se mezcla previa y posterior de los datos (mantenimiento de pares).

Voy a tratar de publicar algo de código más adelante, si usted todavía necesita ayuda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X