Sé cómo generar Pearson $r$ los valores de correlación en Excel y en R.
Entiendo el significado del valor como rangos de $-1<r<1$
Yo también entiendo que las pruebas de hipótesis, intervalos de confianza, y $p$-valor. ($p$ = la probabilidad de que este resultado se debe al azar o a la variación natural y la hipótesis nula es verdadera)
Sin embargo, estoy teniendo problemas para hacer la conexión entre Pearson $r$ de correlación y $p$-valor. En una prueba de hipótesis, que hay un elemento de azar de la variación de los resultados (como la moneda para decidir). Pero, en una regresión, se basa en puntos de datos reales. Entonces, ¿qué valor de p significa en este contexto? Las probabilidades de que los puntos de datos son sólo agrupado debido al azar? Es esta basada directamente en el tamaño de la muestra? Lo pregunto porque me pregunto ¿cómo sería una fórmula saber nada acerca de la variabilidad de los puntos de datos discretos (como el precio de venta y el kilometraje de un coche).
Así, para un valor de r, el valor de p se basa en el tamaño de la muestra? Lo que no entiendo es que el p-valor parece responder a una pregunta binaria: Es que hay un efecto o no? Pero para un coeficiente de correlación, no hay un sí/no pregunta.
Si me sale una r = .8, y el p-valor de .20, ¿qué significa eso? Esto significa que hay un 20% de probabilidad de que la correlación de .8 no es cierto? Pero, entonces, ¿qué ES la verdad? r=.7 ? r=.6?
O es la regla general de que sólo se puede utilizar el valor de r, independientemente de la cantidad, si p < .05 ?
Si me sale una r = .1, y el p-valor de .0001, ¿qué significa eso? Estamos muy seguros de que existe una muy débil correlación? (¿ Irónico?)
Si me sale una r = .5, y el p-valor de .0001, ¿qué significa eso? Estamos muy seguros de que existe una correlación moderada?
Si me sale una r = .5, y el p-valor de .3, ¿qué significa eso? Esto significa que hay un 30% de probabilidades de que existe una moderada correlación de .5 ?