¿En qué casos se debe preferir uno sobre el otro?
Encontré a alguien que afirma una ventaja para Kendall, por razones pedagógicas, ¿hay otras razones?
¿En qué casos se debe preferir uno sobre el otro?
Encontré a alguien que afirma una ventaja para Kendall, por razones pedagógicas, ¿hay otras razones?
Descubrí que la correlación de Spearman se utiliza principalmente en lugar de la correlación lineal habitual cuando se trabaja con puntuaciones enteras en una escala de medición, cuando tiene un número moderado de posibles puntuaciones o cuando no queremos basarnos en suposiciones sobre las relaciones bivariadas. En comparación con el coeficiente de Pearson, la interpretación de tau de Kendall me parece menos directa que la de rho de Spearman, en el sentido de que cuantifica la diferencia entre el % de pares concordantes y discordantes entre todos los eventos posibles en pares. En mi entendimiento, tau de Kendall se parece más a Goodman-Kruskal Gamma.
Acabo de leer un artículo de Larry Winner en J. Statistics Educ. (2006) que analiza el uso de ambas medidas, Resultados de carreras de la Copa Winston de NASCAR de 1975-2003.
También encontré la respuesta de @onestop sobre Correlación de Pearson o Spearman con datos no normales interesante en este sentido.
Cabe destacar que el tau de Kendall (la versión a) tiene conexión con D de Somers (y C de Harrell) utilizado para modelado predictivo (ver por ejemplo, Interpretación de D de Somers bajo cuatro modelos simples por RB Newson y referencia 6 en él, y artículos de Newson publicados en el Stata Journal 2006). Se proporciona un resumen de pruebas de suma de rangos en Cálculo eficiente de intervalos de confianza de jackknife para estadísticas de rango, que se publicó en JSS (2006).
Me remito al honorable caballero a mi respuesta anterior: "...los intervalos de confianza para rS de Spearman son menos confiables y menos interpretables que los intervalos de confianza para los -parámetros de Kendall", según Kendall & Gibbons (1990).
Otra vez una respuesta algo filosófica; la diferencia básica es que Rho de Spearman es un intento de extender la idea de R^2 (="varianza explicada") sobre interacciones no lineales, mientras que Tau de Kendall está más bien pensado para ser una estadística de prueba para pruebas de correlación no lineales. Por lo tanto, Tau debería usarse para probar correlaciones no lineales, Rho como extensión de R (o para personas familiarizadas con R^2 -- explicar Tau a una audiencia desprevenida en poco tiempo es doloroso).
¿Podrías explicar por favor las "interacciones no lineales"? El coeficiente de Spearman Rho parece reflejar una medida de validez en términos de psicometría. No sé nada sobre la naturaleza de Tau.
"interacciones no lineales" porque lo único que importa es el orden, no la correlación lineal. Por ejemplo, $x$ y $x^2$ tienen una correlación de Pearson de 0, mientras que el tau de Kendall o el rho de Spearman tendrán un puntaje de 1.
Aquí hay una cita de Andrew Gilpin (1993) abogando por el coeficiente de Kendall sobre el de Spearman por razones teóricas:
"[El coeficiente de Kendall] se aproxima más rápidamente a una distribución normal que el de Spearman, a medida que aumenta N, el tamaño de la muestra; y Kendall también es más manejable matemáticamente, especialmente cuando hay empates."
Gilpin, A. R. (1993). Tabla para la conversión de Tau de Kendall a Rho de Spearman dentro del contexto de las medidas de magnitud del efecto para meta-análisis. Educational and Psychological Measurement, 53(1), 87-92.
Para lo que vale, una cita de Myers & Well (diseño de investigación y análisis estadístico, segunda edición, 2003, p. 510). Si todavía te importan los valores p;
Seigel y Castellan (1988, estadísticas no paramétricas para las ciencias del comportamiento) señalan que, aunque $\tau$ y Spearman $\rho$ generalmente tendrán valores diferentes al calcularse para el mismo conjunto de datos, cuando las pruebas de significancia para $\tau$ y Spearman $\rho$ se basan en sus distribuciones muestrales, darán los mismos valores de p.
¿Sabes si ofrecen algún respaldo para esta afirmación? No veo cómo puede ser verdad en general (pueden ser bastante similares con frecuencia, pero realmente no veo cómo puede sostenerse la afirmación de que serán iguales). [Me pregunto si Siegel y Castellan dijeron exactamente eso, o algo ligeramente diferente.]
He comprobado Siegel&Castellan (2ª ed p253). Ellos dicen algo ligeramente diferente... pero de hecho es ligeramente peor que la paráfrasis anterior, incluso con la adición de "aproximadamente" (peor porque lo restringen a ser el caso bajo la nula, pero como están condicionados en los datos eso no ayudará. De todos modos, para un orden fijo de $x$, todos los posibles órdenes de rango de $y$ son igualmente probables bajo H0.) El hecho de que piensen que condicionar en la nula después de condicionar en los datos importa es preocupante. Me pregunto si quisieron decir algo más o si realmente no entienden.
Como contraejemplo, toma n=7 y valores p exactos. Sea x=1,2,3,4,5,6,7 y sea y = 2,1,4,3,7,6,5 ... spearman da p=0.048, Kendall da 0.136 ... que no se parecen en absoluto. Una disposición diferente da el mismo valor para Kendall pero Spearman tiene p=0.302. Hay muchos ejemplos así y varios tamaños de muestra
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.
0 votos
Ver también una pregunta relacionada stats.stackexchange.com/q/18112/3277.
1 votos
Desafortunadamente, el enlace en tu pregunta está roto. Supongo que te refieres a Noether (2007, Teaching Statistics). ¿Quieres editarlo?
0 votos
Ver Spearman Correlation Quantifies Comonotonicity.