He votado la respuesta de rinspy. Aquí, voy a tratar de añadir algunas cosas.
~ ~ ~
r y p -valor miden cosas diferentes.
En p -valor indica la probabilidad de obtener datos tan extremos† como los observados. suponiendo que la hipótesis nula sea cierta . Según nuestra regla de decisión, si p < alfa tenemos pruebas suficientes para rechazar la hipótesis nula de que no hay correlación. Y eso es todo p -valor hace por nosotros.
En p -el resultado suele ser mucho menos informativo de lo que pretendemos. Concluir que hay un estadísticamente significativo correlación no nos dice cómo de fuerte es la correlación, y desde luego no nos dice si la correlación tiene importancia práctica.
r es una medida del tamaño del efecto. Nos dice lo fuerte que es la correlación.
La interpretación de los tamaños de los efectos depende necesariamente de la disciplina y de las expectativas del análisis. En física o química, puede esperarse una relación casi perfecta, mientras que en macrobiología o psicología, puede ser notable un tamaño del efecto mucho menor. Cohen (1988) da algunas pautas para las ciencias del comportamiento: Pequeño, 0,10; Medio, 0,30; Grande 0,50.
~ ~ ~
Los tamaños de los efectos no se ven afectados por el tamaño de la muestra, mientras que un p -El valor se verá afectado por el tamaño de la muestra para un tamaño del efecto determinado.
Considere x \= (1, 2, 3), y \= (1, 1, 2). Aquí, r \= 0.866; p \= 0.33.
Ahora, mantendremos los mismos valores, pero duplicaremos el número de observaciones para cada uno de x y y . El tamaño del efecto sigue siendo exactamente el mismo. Pero ahora, con seis observaciones, y un r de 0,866, el p -disminuye por debajo de 0,05.
x \= (1, 2, 3, 1, 2, 3), y \= (1, 1, 2, 1, 1, 2). r \= 0.866; p \= 0.03.
Y volveremos a aumentar el tamaño de la muestra.
x \= (1, 2, 3, 1, 2, 3, 1, 2, 3), y \= (1, 1, 2, 1, 1, 2, 1, 1, 2). r \= 0.866; p \= 0.003.
Para muestras pequeñas, un tamaño del efecto puede no ser muy informativo. Por ejemplo, si medimos la altura y el peso de dos personas, encontraremos que la altura y el peso están perfectamente correlacionados, y r \= 1. Esto no nos impresionará. Si aumentamos el tamaño de la muestra a tres o cuatro, es posible que aún encontremos un gran r valor, pero sepa que podría tratarse perfectamente de una casualidad. En este caso, podríamos confiar más en el p -valor para determinar si ocurre algo interesante.
Para muestras de mayor tamaño, a p -puede ser significativo incluso si el r es pequeño. Aquí, queremos asegurarnos de que nos fijamos en el tamaño del efecto, r y no dar demasiada importancia a la p -valor.
~ ~ ~
r no siempre es la mejor manera de comprender la magnitud de una correlación. Por ejemplo, si le hablara de una correlación entre el rendimiento del maíz y la dosis de fertilizante, " p \= 0.01; r \= 0,4" podría ser interesante. Pero probablemente usted querría saber algo como: "Para un aumento de 5 kg/ha de fertilizante, el rendimiento del maíz aumentó 1000 kg/ha".
† En este caso, "tan extremo" significa tan correlacionado.
Referencia Cohen, J. 1988. Statistical Power Analysis for the Behavioral Sciences, 2ª edición. Routledge.
2 votos
Con datos suficientes, se puede obtener un resultado significativo que no es sustancial. Su cita dice "Si nuestro Pearson $r$ eran $0.01$ podríamos concluir que nuestras variables no eran fuertemente correlacionado"
0 votos
@Henry Esa frase tiene sentido para mí, efectivamente, sin embargo la anterior (en negrita) me confunde.
1 votos
Sugiere que la mayoría ( $99.99\%$ en este caso) de la varianza de una variable no está asociada a la varianza de la otra
1 votos
@BramVanroy la frase en negrita no es estrictamente correcta. Pero en la práctica, cuando decimos que dos variables están correlacionadas, asumimos alguna correlación no trivial-pequeña, dependiendo del dominio.
0 votos
En la modelización de la contaminación atmosférica, se pueden seguir cohortes de más de 100.000 personas durante décadas para lograr la potencia necesaria para detectar efectos muy pequeños. Cuando se encuentra una asociación entre la contaminación del aire ambiente y las enfermedades cardiacas con una r de 0,04, se trata de un hallazgo muy significativo con implicaciones para la política. Todo el mundo está expuesto.