Tengo dos conjuntos de datos donde tengo a ~250.000 valores de 78 y 35 muestras. Algunas de las muestras son miembros de una familia y esto puede tener un efecto de los datos. He calculado pares de correlación y varía entre 0,7 y 0.95, pero me gustaría saber si hay diferencias significativas en los coeficientes de correlación intra vs inter familia? ¿Cuál es la mejor manera de hacer esto? Gracias
Respuestas
¿Demasiados anuncios?De una manera general para comparar dos coeficientes de correlación $\hat{\rho}_{1}, \hat{\rho}_{2}$ es para uso de Fisher z-método de transformación, que dice que ${\rm arctanh}(\hat{\rho})$ es aproximadamente normal con una media de ${\rm arctanh}(\rho)$ y la desviación estándar $1/\sqrt{n-3}$. Si las muestras son independientes, entonces usted transformar cada coeficiente de correlación y la diferencia entre los dos transformado correlaciones será normal con una media de ${\rm arctanh}(\rho_{1})-{\rm arctanh}(\rho_{2})$ y la desviación estándar $\sqrt{1/(n_{1}-3) + 1/(n_{2}-3)}$. A partir de esta se puede formar un $z$-estadística y hacer la prueba, como en la ordinaria de dos muestras de $z$-prueba.
Aunque @Macro respuesta es agradable, lo que requiere una suposición acerca de la (in)dependencia de las estadísticas. Otro enfoque sería utilizar el arranque. La idea sería mantener una variable fija y aleatoria de la otra variable, el cálculo de la correlación para cada una de las muestras, y tome su diferencia. Repetir muchas veces para conseguir una distribución y el uso de esta distribución para probar la hipótesis de que las correlaciones son el mismo. La estructura del conjunto de datos no son muy claros para mí, así que es difícil dar más detalles.