1 votos

¿Qué significa exactamente "correlación significativa"?

He realizado la correlación entre varias variables. R permite separar las correlaciones significativas de las no significativas. Observé que las correcciones bajas (corr=0,4) pueden considerarse significativas (valor p<0,05), mientras que las no significativas (valor p>0,05) pueden asumir valores relativamente altos (corr=0,7 ).

En este sentido, me gustaría saber qué significa exactamente decir que una correlación es más significativa que otra ¿qué argumentos podría utilizar para explicar la situación anterior?

4voto

Rob Allen Puntos 486

Es normalmente una prueba que indica si se puede inferir que la correlación "verdadera" (población) es distinta de cero. $$ \begin{align} H_0&: \textrm{The two variables are uncorrelated. } &(r = 0) \\ H_a&: \textrm{The two variables are correlated. } &(r \ne 0) \\ \end{align} $$

Por lo general, sólo se tiene acceso a una muestra de valores de las dos variables de interés. Se podría imaginar que es fácil deducir una correlación fuerte entre dos variables a partir de una muestra pequeña, pero se necesitan más datos para determinar si una relación aparente es una correlación débil o sólo ruido. La fórmula del estadístico de prueba respalda esta intuición: es una función del tamaño de la muestra ( $n$ ) y la correlación muestral ( $r$ ). Una forma de comprobarlo es mediante la distribución t. Se calcula:

$$t^* \approx\dfrac{r\sqrt{n-2}}{\sqrt{1-r^2}}$$

a continuación, utilice el $t_{n-2}$ para convertirlo en un $p$ -que indica la probabilidad de ver una correlación al menos tan grande en la muestra. si la correlación de la población es cero . Otros enfoques utilizan una fórmula "exacta" ligeramente diferente, que de nuevo sólo es función de $r$ y $n$ y pueden interpretarse de la misma manera.

Tenga en cuenta que esto realmente le dice qué puede reclamar , basado en una muestra: un gran $p$ -valor no significa necesariamente que la correlación sea exactamente cero, sólo que no se puede decir si lo es o no dados los datos.

Esto es lo que Matlab corr de SciPy scipy.stats.mstats.pearsonr y R's cor.test por defecto. Hay, por supuesto, otras pruebas que se pueden ejecutar en las correlaciones (por ejemplo, para comparar dos correlaciones), así que compruebe para asegurarse.

1voto

Dave Puntos 76

Si escribes la fórmula para calcular el estadístico de la prueba, verás que el tamaño de la muestra es un factor.

Si el valor de la correlación es pequeño pero el tamaño de la muestra es grande, el valor p puede ser pequeño, lo que indica que hay pruebas sólidas de que la correlación no es cero. Incluso si la correlación real es trivialmente distinta de cero, como por ejemplo $0.01$ ese número no es cero.

Si el tamaño de la muestra es pequeño, es posible que necesite un valor de correlación muy grande para que la prueba de hipótesis arroje un valor p pequeño.

Como en todas las pruebas de hipótesis, el tamaño de la muestra desempeña un papel fundamental en las pruebas de correlación.

Para más información, puede que le interese la diferencia entre significación práctica y estadística, así como las pruebas de equivalencia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X