Descargo de responsabilidad: si encuentras esta pregunta demasiado parecida a otra, me alegro de que se fusione. Sin embargo, no he encontrado una respuesta satisfactoria en ningún otro sitio (y todavía no tengo la "reputación" para comentar o upvote), así que pensé que sería mejor hacer una nueva pregunta a mí mismo.
Mi pregunta es la siguiente. Para cada uno de los 12 sujetos humanos, he calculado un coeficiente de correlación (rho de Spearman) entre 6 niveles de una variable independiente X, y las observaciones correspondientes de una variable dependiente Y. (Nota: los niveles de X no son iguales en todos los sujetos.) Mi hipótesis nula es que en la población general, esta correlación es igual a cero. He comprobado esta hipótesis de dos maneras:
-
Utilizando una prueba t de una muestra sobre los coeficientes de correlación obtenidos de mis 12 sujetos.
-
Centrando mis niveles de X y observaciones de Y de tal forma que para cada participante, media(X) = 0 y media(Y) = 0, y luego calculando una correlación sobre los datos agregados (72 niveles de X y 72 observaciones de Y).
Ahora, leyendo sobre cómo trabajar con coeficientes de correlación (aquí y en otros sitios) he empezado a dudar de que el primer planteamiento sea válido. En particular, he visto la siguiente ecuación aparecer en varios sitios, presentada (aparentemente) como una prueba t para coeficientes de correlación medios:
$$t = \frac{r}{SE_{r}} = \frac{\sqrt{n-2}}{\sqrt{1-r^{2}}}$$
donde $r$ sería el coeficiente de correlación medio (y supongamos que lo hemos obtenido utilizando primero la transformación de Fisher sobre los coeficientes por sujeto) y $n$ el número de observaciones. Intuitivamente, esto me parece incorrecto, ya que no incluye ninguna medida de la variabilidad entre sujetos. En otras palabras, si tuviera 3 coeficientes de correlación, obtendría el mismo estadístico t tanto si fueran [0,1, 0,5, 0,9] como [0,45 0,5 0,55] o cualquier rango de valores con la misma media (y $n=3$ )
Sospecho, por tanto, que la ecuación anterior no se aplica en realidad cuando se comprueba la significación de una media de coeficientes de correlación, sino cuando se comprueba la significación de un único coeficiente de correlación basado en $n$ observaciones de 2 variables.
¿Podría alguien confirmar esta intuición o explicar por qué es errónea? Además, si esta fórmula no se aplica a mi caso, ¿alguien conoce un enfoque correcto? ¿O tal vez mi propia prueba número 2 ya es válida? Cualquier ayuda es muy apreciada (incluidos los punteros a las respuestas anteriores que puedo haber perdido o malinterpretado).