5 votos

¿Cuál es la relación con$p$ - valor al generar el coeficiente de correlación de Pearson$r$?

Sé cómo generar Pearson $r$ los valores de correlación en Excel y en R.

Entiendo el significado del valor como rangos de $-1<r<1$

Yo también entiendo que las pruebas de hipótesis, intervalos de confianza, y $p$-valor. ($p$ = la probabilidad de que este resultado se debe al azar o a la variación natural y la hipótesis nula es verdadera)

Sin embargo, estoy teniendo problemas para hacer la conexión entre Pearson $r$ de correlación y $p$-valor. En una prueba de hipótesis, que hay un elemento de azar de la variación de los resultados (como la moneda para decidir). Pero, en una regresión, se basa en puntos de datos reales. Entonces, ¿qué valor de p significa en este contexto? Las probabilidades de que los puntos de datos son sólo agrupado debido al azar? Es esta basada directamente en el tamaño de la muestra? Lo pregunto porque me pregunto ¿cómo sería una fórmula saber nada acerca de la variabilidad de los puntos de datos discretos (como el precio de venta y el kilometraje de un coche).

Así, para un valor de r, el valor de p se basa en el tamaño de la muestra? Lo que no entiendo es que el p-valor parece responder a una pregunta binaria: Es que hay un efecto o no? Pero para un coeficiente de correlación, no hay un sí/no pregunta.

Si me sale una r = .8, y el p-valor de .20, ¿qué significa eso? Esto significa que hay un 20% de probabilidad de que la correlación de .8 no es cierto? Pero, entonces, ¿qué ES la verdad? r=.7 ? r=.6?

O es la regla general de que sólo se puede utilizar el valor de r, independientemente de la cantidad, si p < .05 ?

Si me sale una r = .1, y el p-valor de .0001, ¿qué significa eso? Estamos muy seguros de que existe una muy débil correlación? (¿ Irónico?)

Si me sale una r = .5, y el p-valor de .0001, ¿qué significa eso? Estamos muy seguros de que existe una correlación moderada?

Si me sale una r = .5, y el p-valor de .3, ¿qué significa eso? Esto significa que hay un 30% de probabilidades de que existe una moderada correlación de .5 ?

7voto

AusTravel Puntos 6

[Fijo/mejorado, basado en la retroalimentación de @Momo y @whuber]

Yo creo que en el contexto de la regresión de la relación entre el $p$-valor y el coeficiente de correlación de Pearson es la siguiente: $p$-valor que puede interpretarse como la probabilidad de que la correlación (coeficiente), determinado en un muestreo aleatorio basado en el experimento, es la misma o mayor que la una, determinada a partir de los datos observados, a condición de que la hipótesis nula es verdadera. En otras palabras, creo que el $p$-valor en este contexto está relacionado con la prueba de hipótesis, donde la hipótesis en sí, son basado en la correlación, como sigue:

\begin{multline} \shoveleft{H_0: \text{correlation (of the underlying data-generation process) is zero;}}\\ \shoveleft{H_A: \text{the correlation is not zero.}} \end{multline}

Entonces, la situación en mi humilde opinión se reduce a la siguiente tradicionales pruebas de hipótesis de interpretación. Si $p$-valor es pequeño (menos de seleccionados arbitrariamente un nivel de significación del $\alpha$, por lo general igual a 0,05), entonces se puede rechazar la hipótesis nula ("determinó la correlación es estadísticamente significativa"), y, si $p$-valor es mayor que $\alpha$, que no se puede rechazar la nula ("la correlación no es estadísticamente significativa").

En cuanto a una relación entre el $p$-valor y el tamaño de la muestra $N$, las siguientes fórmulas presente la relación en cuestión en forma matemática.

Fisher transformado prueba estadística de $r$ (aka $z$) se define como el $T(r) = artanh(r)$.

Para una distribución normal bivariante, $z$'s error estándar depende del tamaño de la muestra $N$, como sigue:

\begin{align} SE(T(r)) \approx \frac{1}{\sqrt{N - 3}} \end{align}

Además, dado que el estadístico de prueba es aproximadamente normal,

\begin{align} \frac{T(r)}{SE(T(r))} \approx N(0,1) \text{ and } \lim_{N\to\infty} SE(T(r)) = 0 \end{align}

así que el error estándar en el denominador está consiguiendo cada vez más pequeños para el tamaño creciente de la $N$.

P. S. Usted puede también encontrar los siguientes dos respuestas pertinentes y útiles: este y este.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X