1 votos

Interpretación de $N$ y $p$ en la prueba de correlación de Pearson?

En este papel los autores informan de una estimación de $r = 0.86,\, N = 28,\, p < 0.001,$ mediante la prueba de correlación de Pearson. El parámetro $r$ (o $\rho$ ) está claro para mí, pero ¿cómo son $N$ y $p$ ¿se derivan y se interpretan?

3voto

BruceET Puntos 7117

En la notación que cita de este documento $r$ es la correlación de la muestra; estima la correlación de la población $\rho.$ $N$ es el número de $(x,y)$ -pares en los que se basa la prueba. Muchos textos utilizan $n$ porque esto es una muestra.

Esta es una prueba de $H_0: \rho = 0$ contra $H_1: \rho \ne 0$ .

Bajo el supuesto de que $H_0$ es cierto y que los datos son normales bivariados, esta prueba calcula el estadístico de prueba $t = r\sqrt{\frac{n-2}{1-r^2}}$ , que tiene la distribución t de Student con $n -2$ grados de libertad, El símbolo $p$ es para el valor P de la prueba. A grandes rasgos, es la probabilidad de que el valor de $|r|$ está más lejos de 0 que el valor observado ( $r = 0.86$ En el ejemplo que usted proporciona).

En concreto, en este ejemplo tenemos $t = 0.86\sqrt{26/(1 - 0.86^2)} = 8.593$ El valor P exacto es la probabilidad de que $P(T > 8.593) + P(T < -8.593),$ donde $T$ es una variable aleatoria que tiene la t de Student con $DF = 26.$ Mediante un software estadístico, el suma de estas probabilidades resulta ser $4.51 \times 10^{-9}.$

El valor P notificado $< 0.001,$ indica que el valor P real es inferior a 0,001. (Posiblemente, este es el mejor valor disponible en las tablas impresas a disposición del autor). En cualquier caso, uno se siente seguro creyendo que el $\rho = 0$ no es la verdadera correlación de la población.

Notas: (1) No tengo ni idea de si el supuesto de normalidad es válida. Dado el valor bastante alto $r = 0.86$ y con una mirada a la gráficos de dispersión proporcionados, supongo que la suposición es segura. [El artículo de Wikipedia sobre la "correlación de Pearson" menciona enfoques alternativos en caso de que los datos sean no son normales, pero usted no tiene los datos originales, por lo que no se pueden aplicar estos métodos]. (2) Aunque no es evidente de las fórmulas, esta prueba es exactamente la misma que la prueba de que la pendiente de la recta de regresión ( $\beta$ en el papel al que te refieres) de y en x (o de x en y) es 0.

Apéndice (sugerido por un revisor externo tras la aceptación de esta respuesta): Suponga que quiere conocer los valores exactos de $r$ que conducen al rechazo de $H_0$ con un nivel de significación de 0,001 = 0,1%. De las tablas t impresas con $DF = n-2 = 28-2= 26,$ vemos que $t_{.0005} = 3.7454$ probabilidad de cortes 0,0005 de la cola superior de la función de densidad de la distribución t por lo que el $P(|T|>3.7454) = 0.001.$ La resolución de la la fórmula anterior para $r$ vemos que, $t_{.0005} = 3.7454$ corresponde a $r = t/\sqrt{n-2+t^2} = 0.592,$ por lo que rechazaríamos al nivel 0,001 para cualquier $r$ con $|r| > 0.592.$ [Para el nivel del 1%, $t_{.005} = 2.7969$ y rechazamos por $|r| > 0.481.$ ]

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X