12 votos

¿Qué indica cuando la correlación de Spearman es una cantidad definida de menos de Pearson?

Tengo un montón de conjuntos de datos relacionados. Las correlaciones de pearson entre pares de ellos por lo general son definitivamente más grandes que las correlaciones de spearman. Sugiere cualquier correlación es lineal, pero es de esperar aunque el pearson y spearman eran los mismos. ¿Qué significa cuando hay una brecha definitiva entre el pearson y la correlación de spearman y la pearson es mayor? Esto parece ser una característica constante en mis bases de datos.

14voto

alexs77 Puntos 36

La correlación de Spearman es sólo el de correlación de Pearson, utilizando los rangos (estadísticas de orden) en lugar de los valores numéricos reales. La respuesta a tu pregunta es que no se está midiendo lo mismo. Pearson: tendencia lineal, Spearman: la tendencia monotónica. Que la correlación de Pearson es mayor, sólo significa que la correlación lineal es mayor que el rango de correlación. Esto es probablemente debido a los influyentes observaciones en las colas de la distribución que tiene gran influencia en relación a sus valores clasificados. Pruebas de asociación mediante la correlación de Pearson son de mayor potencia cuando la linealidad de la que tiene en los datos.

0voto

Chris Cudmore Puntos 634

La Correlación de Pearson se supone varios supuestos para ser precisos: 1) Cada variable se distribuye normalmente; 2) Homoscedasticity, la varianza de cada variable se mantiene constante; y 3) la Linealidad, lo que significa que un gráfico de dispersión que representa la relación de la muestra de puntos de datos de la agrupación de manera simétrica alrededor de la línea de regresión.

La Correlación de Spearman es una alternativa no paramétrica a la prueba de Pearson uno basado en el rango de las observaciones. La Correlación de Spearman le permite relajarse todos los tres supuestos sobre el conjunto de datos y obtener correlaciones que son razonablemente precisas.

Lo que sus datos implica es que, probablemente, se rompe materialmente uno o más de los mencionados supuestos materialmente, para que las dos correlaciones difieren significativamente.

Dado que disponemos de una gran brecha entre los dos correlación usted debe investigar si las variables del conjunto de datos están distribuidos normalmente, homoscedástica, y lineal dentro de un diagrama de dispersión.

La anterior investigación facilitará su decisión sobre si los Lanceros, o el coeficiente de correlación de Pearson es la más representativa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X