6 votos

Diferencia entre r de Pearson ~= 0 y p > 0,05

La estadística es mi debilidad, por lo que los detalles son importantes para entender lo que está pasando. Estaba leyendo este sitio web introductorio sobre estadísticas y dicen lo siguiente (el subrayado es mío).

Cuando la r de Pearson es cercana a 0 Esto significa que hay una débil relación entre sus dos variables. Esto significa que los cambios en una variable no están correlacionados con los cambios en la segunda variable. Si nuestra r de Pearson fuera 0,01, podríamos concluir que nuestras variables no estaban fuertemente correlacionadas.

¿Significa esto que incluso si su valor p de 2 colas es < 0,05, un valor cercano a cero para r ¿significa que no hay correlación?

Resumiendo: si p < 0,05 O r ~= 0, ¿no hay correlación? ¿Es correcto?

2 votos

Con datos suficientes, se puede obtener un resultado significativo que no es sustancial. Su cita dice "Si nuestro Pearson $r$ eran $0.01$ podríamos concluir que nuestras variables no eran fuertemente correlacionado"

0 votos

@Henry Esa frase tiene sentido para mí, efectivamente, sin embargo la anterior (en negrita) me confunde.

1 votos

Sugiere que la mayoría ( $99.99\%$ en este caso) de la varianza de una variable no está asociada a la varianza de la otra

13voto

rinspy Puntos 106

Los valores p y el coeficiente de correlación de Pearson $r$ miden cosas diferentes.

$r$ mide la fuerza de la correlación. El valor p, por otro lado, mide la probabilidad de observar una correlación de esta intensidad bajo la hipótesis nula, es decir, bajo el supuesto de que las variables aleatorias no están correlacionadas.

Intuitivamente, cuanto más fuerte es la correlación que se observa, menos probable es que se haya producido por casualidad a partir de dos variables no correlacionadas. Sin embargo, incluso si observa una correlación muy débil, puede tener un valor p muy bajo asociado a esta observación; por ejemplo, a medida que el tamaño de la muestra aumenta hasta el infinito, obtendrá valores p muy bajos incluso si la correlación observada es muy débil.

Así que para responder a su pregunta: $r$ cercano a 0 y un valor p < 0,05 significaría que existe una correlación, pero es muy débil.

4voto

Sal Mangiafico Puntos 26

He votado la respuesta de rinspy. Aquí, voy a tratar de añadir algunas cosas.

~ ~ ~

r y p -valor miden cosas diferentes.

En p -valor indica la probabilidad de obtener datos tan extremos† como los observados. suponiendo que la hipótesis nula sea cierta . Según nuestra regla de decisión, si p < alfa tenemos pruebas suficientes para rechazar la hipótesis nula de que no hay correlación. Y eso es todo p -valor hace por nosotros.

En p -el resultado suele ser mucho menos informativo de lo que pretendemos. Concluir que hay un estadísticamente significativo correlación no nos dice cómo de fuerte es la correlación, y desde luego no nos dice si la correlación tiene importancia práctica.

r es una medida del tamaño del efecto. Nos dice lo fuerte que es la correlación.

La interpretación de los tamaños de los efectos depende necesariamente de la disciplina y de las expectativas del análisis. En física o química, puede esperarse una relación casi perfecta, mientras que en macrobiología o psicología, puede ser notable un tamaño del efecto mucho menor. Cohen (1988) da algunas pautas para las ciencias del comportamiento: Pequeño, 0,10; Medio, 0,30; Grande 0,50.

~ ~ ~

Los tamaños de los efectos no se ven afectados por el tamaño de la muestra, mientras que un p -El valor se verá afectado por el tamaño de la muestra para un tamaño del efecto determinado.

Considere x \= (1, 2, 3), y \= (1, 1, 2). Aquí, r \= 0.866; p \= 0.33.

Ahora, mantendremos los mismos valores, pero duplicaremos el número de observaciones para cada uno de x y y . El tamaño del efecto sigue siendo exactamente el mismo. Pero ahora, con seis observaciones, y un r de 0,866, el p -disminuye por debajo de 0,05.

x \= (1, 2, 3, 1, 2, 3), y \= (1, 1, 2, 1, 1, 2). r \= 0.866; p \= 0.03.

Y volveremos a aumentar el tamaño de la muestra.

x \= (1, 2, 3, 1, 2, 3, 1, 2, 3), y \= (1, 1, 2, 1, 1, 2, 1, 1, 2). r \= 0.866; p \= 0.003.

Para muestras pequeñas, un tamaño del efecto puede no ser muy informativo. Por ejemplo, si medimos la altura y el peso de dos personas, encontraremos que la altura y el peso están perfectamente correlacionados, y r \= 1. Esto no nos impresionará. Si aumentamos el tamaño de la muestra a tres o cuatro, es posible que aún encontremos un gran r valor, pero sepa que podría tratarse perfectamente de una casualidad. En este caso, podríamos confiar más en el p -valor para determinar si ocurre algo interesante.

Para muestras de mayor tamaño, a p -puede ser significativo incluso si el r es pequeño. Aquí, queremos asegurarnos de que nos fijamos en el tamaño del efecto, r y no dar demasiada importancia a la p -valor.

~ ~ ~

r no siempre es la mejor manera de comprender la magnitud de una correlación. Por ejemplo, si le hablara de una correlación entre el rendimiento del maíz y la dosis de fertilizante, " p \= 0.01; r \= 0,4" podría ser interesante. Pero probablemente usted querría saber algo como: "Para un aumento de 5 kg/ha de fertilizante, el rendimiento del maíz aumentó 1000 kg/ha".


† En este caso, "tan extremo" significa tan correlacionado.

Referencia Cohen, J. 1988. Statistical Power Analysis for the Behavioral Sciences, 2ª edición. Routledge.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X