Los p-valores proporcionados por la base de Matlab y Pylab de correlación de Pearson funciones están indicadas para ser inexactos para tamaños de muestra pequeños, o cuando las muestras no están distribuidos normalmente. La documentación de python sugiere el uso de un N>500 para el p-valor para ser exactos, mientras que la documentación de Matlab da ningún límite de tiempo específico distinto de "grande".
¿Alguien sabe de un método que puede correctamente la prueba de significación estadística del coeficiente de correlación de Pearson bajo tales circunstancias?
Mi instinto es que yo sólo podía realizar una prueba de permutación por la codificación de X o Y los valores y re-muestreo, el coeficiente de correlación de Pearson de los datos cifrados, entonces el uso de la distribución para obtener un intervalo de confianza. Pero, ¿será esto correcto?