Estoy tratando de replicar Silver & Dunlap (1987) . Sólo estoy comparando correlaciones promediadas o correlaciones promediadas de transformación z y transformación de vuelta. Parece que no estoy replicando la asimetría en el sesgo que encuentran (las zs transformadas de vuelta no están más cerca del valor de la población para mí que las rs). ¿Alguna idea? ¿Es posible que la potencia de computación de 1987 no explorara lo suficiente el espacio?
# Fisher's r2z
fr2z <- atanh
# and back
fz2r <- tanh
# a function that generates a matrix of two correlated variables
rcor <- function(n, m1, m2, var1, var2, corr12){
require(MASS)
Sigma <- c(var1, sqrt(var1*var2)*corr12, sqrt(var1*var2)*corr12, var2)
Sigma <- matrix(Sigma, 2, 2)
return( mvrnorm(n, c(m1,m2), Sigma, empirical=FALSE) )
}
Con estas funciones es fácil mirar un montón de correlaciones (básicamente replicar plata y dunlap 1987) y ver la diferencia entre promediar correlaciones y promediar z-scores y volver a transformar. Aquí hay sólo una.
r <- 0.9
Y <- replicate(20000, rcor(10, 0, 0, 1, 1, r))
rs <- apply(Y, 3, function(x) cor(x[,1], x[,2]))
mean(rs) - r
zs <- fr2z(rs)
fz2r( mean(zs) ) - r
Sólo mirando el tamaño de la muestra de 10 y las correlaciones de 0,1, 0,5 y 0,9 estos son los resultados.
rho r bias z bias
0.1 -0.006 0.006
0.5 -0.024 0.021
0.9 -0.011 0.011
Y estos se derivan de la Tabla 1 de Silver & Dunlap.
rho r bias z bias
0.1 -0.007 0.003
0.5 -0.025 0.001
0.9 -0.011 -0.007
Estos son resultados bastante diferentes. De mi prueba estoy viendo que es sólo una cuestión de dirección del sesgo, no de magnitud. Pero, en el artículo publicado están encontrando mucha menos magnitud con z. No pude encontrar una no-replicación publicada.