24 votos

Stouffer del Z-score método: lo que si sumamos $z^2$ en lugar de $z$?

Estoy realizando $N$ independiente de pruebas estadísticas con la misma hipótesis nula, y le gustaría combinar los resultados en un $p$-valor. Parece que hay dos "aceptado" métodos: método de Fisher y Stouffer del método.

Mi pregunta es acerca de Stouffer del método. Para cada prueba puedo obtener un z-score $z_i$. En virtud de una hipótesis nula, cada uno de ellos se distribuye con una distribución normal estándar, por lo que la suma de $\Sigma z_i$ sigue una distribución normal con varianza $N$. Por lo tanto Stouffer del método sugiere para calcular $\Sigma z_i / \sqrt{N}$, que debe ser distribuido normalmente con varianza la unidad y, a continuación, utilizar esto como un conjunto de z-score.

Esto es razonable, pero aquí es otro enfoque que se me ocurrió y que también suena razonable para mí. Como cada uno de $z_i$ proviene de una distribución normal estándar, la suma de los cuadrados de los $S=\Sigma z^2_i$ debe provenir de una distribución chi-squared con $N$ grados de libertad. Así, uno puede calcular el $S$, y convertirlo en un $p$-valor de uso acumulado de la chi-cuadrado de la función de distribución de la con $N$ grados de libertad ($p=1−X_N(S)$donde $X_N$ es el CDF).

Sin embargo, en ninguna parte puedo encontrar este enfoque siquiera se menciona. Es utilizado alguna vez? ¿Tiene un nombre? ¿Cuáles serían las ventajas/desventajas en comparación con los Stouffer del método? O hay un error en mi razonamiento?

19voto

jldugger Puntos 7490

Un defecto que sobresale es Stouffer del método puede detectar los cambios sistemáticos en la $z_i$, que es lo que suele ocurrir cuando una de las alternativas es constantemente verdad, mientras que el test de la chi-cuadrado método de aparecerían que tienen menos poder para hacerlo. Una rápida simulación muestra que este sea el caso; el test de la chi-cuadrado método es menos potente para detectar una cara alternativa. Aquí están los histogramas de los valores de p por ambos métodos (rojo=Stouffer, azul=chi-cuadrado) por $10^5$ independiente iteraciones con $N=10$ y varias caras efectos estandarizados $\mu$ desde ninguno ($\mu=0$) por $0.6$ SD ($\mu=0.6$).

Figure

El mejor procedimiento tendrá más zona cercana a cero. Para todos los valores positivos de $\mu$ demostrado, que el procedimiento es el Stouffer procedimiento.


R código de

Esto incluye el método de Fisher (comentada) para la comparación.

n <- 10
n.iter <- 10^5
z <- matrix(rnorm(n*n.iter), ncol=n)

sim <- function(mu) {
  stouffer.sim <- apply(z + mu, 1, 
                    function(y) {q <- pnorm(sum(y)/sqrt(length(y))); 2*min(q, 1-q)})
  chisq.sim <- apply(z + mu, 1, 
                    function(y) 1 - pchisq(sum(y^2), length(y)))
  #fisher.sim <- apply(z + mu, 1,
  #                  function(y) {q <- pnorm(y); 
  #                     1 - pchisq(-2 * sum(log(2*pmin(q, 1-q))), 2*length(y))})
  return(list(stouffer=stouffer.sim, chisq=chisq.sim, fisher=fisher.sim))
}

par(mfrow=c(2, 3))
breaks=seq(0, 1, .05)
tmp <- sapply(c(0, .1, .2, .3, .4, .6), 
              function(mu) {
                x <- sim(mu); 
                hist(x[[1]], breaks=breaks, xlab="p", col="#ff606060",
                     main=paste("Mu =", mu)); 
                hist(x[[2]], breaks=breaks, xlab="p", col="#6060ff60", add=TRUE)
                #hist(x[[3]], breaks=breaks, xlab="p", col="#60ff6060", add=TRUE)
                })

12voto

Daniel Papasian Puntos 266

De una manera general para profundizar en la estadística de prueba es derivar el (generalmente implícita) de los supuestos subyacentes que conducen que el estadístico de prueba para ser más poderoso. Para este caso particular de un estudiante y yo recientemente han hecho esto: http://arxiv.org/abs/1111.1210v2 (una versión revisada es aparecer en los Anales de la Estadística Aplicada).

Muy brevemente resumir (y en consonancia con los resultados de la simulación en otra respuesta) Stouffer del método será más potente cuando el "verdadero" efectos subyacentes son todos iguales; la suma de Z^2 será más poderoso cuando se los efectos subyacentes están distribuidos normalmente alrededor de 0. Esta es una ligera simplificación que omite detalles: consulte la sección 2.5 en el arxiv preprint enlazado más arriba para obtener más detalles.

3voto

jet Puntos 2145

Ligeramente o/t: uno de los problemas con estos dos enfoques es la pérdida de potencia debido a los grados de libertad (N de stouffer; 2N de Fisher). Ha habido mejor meta-métodos analíticos desarrollados por este, que puede que desee considerar (inverso de la varianza ponderada de meta-análisis, por ejemplo).

Si usted está buscando evidencia de algunas pruebas alternativas dentro de un grupo, usted puede desear mirar en Donoho y Jin superior de la crítica de estadística: https://projecteuclid.org/euclid.aos/1085408492

1voto

user54905 Puntos 123

Para responder a la pregunta y para cualquier lectores: es utilizado alguna vez?, no es una lista exhaustiva de papel por los Primos (2008) en arXiv, en la que se enumeran y revisado un par de enfoques alternativos. La propuesta no se parecen aparecer.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X