38 votos

¿Cómo se comparan la gamma de Goodman-Kruskal y las correlaciones tau de Kendall o rho de Spearman?

En mi trabajo, comparamos las clasificaciones previstas con las verdaderas para algunos conjuntos de datos. Hasta hace poco, utilizábamos sólo la prueba de Kendall-Tau. Un grupo que trabaja en un proyecto similar sugirió que intentáramos utilizar la Gamma de Goodman-Kruskal en su lugar, y que lo preferían. Me preguntaba cuáles eran las diferencias entre los distintos algoritmos de correlación de rangos.

Lo mejor que he encontrado ha sido esta respuesta que afirma que Spearman se utiliza en lugar de las correlaciones lineales habituales, y que Kendall-Tau es menos directa y se asemeja más a la Gamma de Goodman-Kruskal. Los datos con los que estoy trabajando no parecen tener correlaciones lineales obvias, y los datos están muy sesgados y no son normales.

Además, Spearman suele indicar una correlación mayor que Kendall-Tau para nuestros datos, y me preguntaba qué dice eso sobre los datos en concreto. No soy estadístico, así que algunos de los artículos que leo sobre estos temas me parecen jerga, lo siento.

3 votos

" Por lo general, la correlación de Spearman es mejor que la de Kendall-Tau para nuestros datos, y me preguntaba qué dice eso sobre los datos en concreto. " ... probablemente nada; Kendall $\tau$ est a menudo más cerca de 0 que la de Spearman $\rho$ cuando las correlaciones no son realmente $0$ o $\pm 1$ - mide la asociación de forma diferente; el hecho de que su magnitud sea normalmente menor no significa que la correlación de Spearman sea "mejor"; simplemente miden cosas diferentes sobre los datos. ¿Qué le lleva a decir que la correlación es "mejor"?

1 votos

Eso era indirectamente lo mismo que mi pregunta, @Glen_b; salvo que yo preguntaba por qué los algoritmos informaban de una correlación mayor y cuál sería la causa. Cambiaré "mejor" por "mayor" para que quede más claro. Tienes razón en que miden cosas diferentes, y que los números no tienen mucho que ver entre sí, pero yo quería saber qué significaban realmente los números, lo que se responde en detalle más abajo.

40voto

Uri Puntos 111

Spearman rho vs Kendall tau . Estos dos son tan computacionalmente diferentes que no puede comparar directamente sus magnitudes. Spearman suele ser superior en 1/4 a 1/3 y esto hace que se concluya erróneamente que Spearman es "mejor" para un conjunto de datos concreto. La diferencia entre rho y tau está en su ideología, proporción de la variación para rho y probabilidad para tau. Rho es una r de Pearson habitual aplicada a datos clasificados y, al igual que r, es más sensible a los puntos con momentos grandes (es decir, desviaciones del centro de la nube) que a los puntos con momentos pequeños. Por lo tanto, rho es bastante sensible a la forma de la nube después de la clasificación hecho: el coeficiente de una nube rómbica oblonga será mayor que el de una nube oblonga achatada (porque los bordes afilados de la primera son momentos grandes). Tau es una extensión de Gamma y es igualmente sensible a todos los puntos de datos por lo que es menos sensible a las peculiaridades de la forma de la nube clasificada. Tau es más "general" que rho, ya que rho sólo se justifica cuando se cree que la relación subyacente (modelo o funcional en la población) entre las variables es estrictamente monótona. Mientras que Tau permite una curva subyacente no monótona y mide qué "tendencia" monótona, positiva o negativa, prevalece allí en general. Rho es comparable a r en magnitud; tau no.

Kendall tau como Gamma . Tau es sólo una forma estandarizada de Gamma. Varias medidas relacionadas tienen todas numerador $P-Q$ pero difieren en la normalización denominador :

  • Gamma: $P+Q$
  • Somers' D("x dependiente"): $P+Q+T_x$
  • Somers' D("y dependiente"): $P+Q+T_y$
  • D("simétrica") de Somers: media aritmética de las dos anteriores
  • Tau-b corr. de Kendall (más adecuada para tablas cuadradas): media geométrica de esas dos
  • Kendall's Tau-c corr $^1$ . (más adecuado para mesas rectangulares): $N^2(k-1)/(2k)$
  • Tau-a corr de Kendall $^2$ . (realiza n ajustes por empates): $N(N-1)/2 = P+Q+T_x+T_y+T_{xy}$

donde $P$ - número de pares de observaciones con "concordancia", $Q$ - con "inversión"; $T_x$ - número de empates por variable X, $T_y$ - por la variable Y, $T_{xy}$ - por ambas variables; $N$ - número de observaciones, $k$ - número de valores distintos en esa variable donde este número es menor.

Así, tau es directamente comparable en teoría y magnitud con Gamma. Rho es directamente comparable en teoría y magnitud con Pearson. $r$ . La agradable respuesta de Nick Stauner aquí explica cómo es posible comparar rho y tau indirectamente.

Ver también sobre tau y rho.


$^1$ Tau-c de una variable consigo misma puede ser inferior a $1$ En concreto, cuando la distribución de $k$ valores distintos es desequilibrada.

$^2$ Tau-a de una variable consigo misma puede estar por debajo de $1$ En concreto, cuando hay empates.

0 votos

En cuanto a la nota 1, ¿qué significa que "la distribución de k valores distintos está desequilibrada"?

1 votos

@teppo, diferentes frecuencias para diferentes valores. Por ejemplo, {1,1,2,2,3,3,3,4} frente a {1,1,2,2,3,3,4,4} .

0 votos

Entonces, ¿podría usar Tau-c de una variable consigo misma como una especie de medida de asimetría?

18voto

Nick Stauner Puntos 8220

He aquí una cita de Andrew Gilpin (1993) en la que defiende la tesis de Maurice Kendall $$ over Spearman's $$ por razones teóricas:

[Kendall's $$] approaches a normal distribution more rapidly than $$ como $N$ el tamaño de la muestra, aumenta; y $$ también es más manejable matemáticamente, sobre todo cuando hay empates.

No puedo añadir mucho sobre Goodman-Kruskal $$, other than that it seems to produce ever-so-slightly larger estimates than Kendall's $$ en una muestra de datos de encuestas con la que he estado trabajando últimamente... y, por supuesto, estimaciones notablemente inferiores a las de Spearman $$. However, I also tried calculating a couple partial $$ (Foraita & Sobotka, 2012), que se acercaban más a las estimaciones parciales de la $$ than the partial $$ ... Sin embargo, me llevó bastante tiempo de procesamiento, así que dejaré las pruebas de simulación o las comparaciones matemáticas para otra persona... (que sabría cómo hacerlas...)

En ttnphns implica, no puedes concluir que tu $$ estimates are better than your $$ estimaciones sólo por magnitud, porque sus escalas difieren (aunque los límites no lo hagan). Gilpin cita a Kendall (1962) para describir la relación de $$ to $$ sea aproximadamente 1,5 en la mayor parte de la gama de valores. Se acercan gradualmente a medida que aumentan sus magnitudes, de modo que cuando ambas se acercan a 1 (o -1), la diferencia se vuelve infinitesimal. Gilpin ofrece una gran tabla de valores equivalentes de $$, $ r $, $ r^2$, d y $Z_r$ hasta el tercer dígito para $$ at every increment of .01 across its range, just like you'd expect to see inside the cover of an intro stats textbook. He based those values on Kendall's specific formulas, which are as follows: $$ \begin{aligned} r &= \sin\bigg(\tau\cdot\frac \pi 2 \bigg) \\ \rho &= \frac 6 \pi \bigg(\tau\cdot\arcsin \bigg(\frac{\sin(\tau\cdot\frac \pi 2)} 2 \bigg)\bigg) \end{aligned} $$ (I simplified this formula for $$ de la forma en que Gilpin escribió, que fue en términos de Pearson $r$ .)

Tal vez tendría sentido para convertir su $$ into a $$ y vea cómo el cambio computacional afecta a su estimación del tamaño del efecto. Parece que esa comparación daría alguna indicación de hasta qué punto los problemas que el modelo de Spearman $$ is more sensitive to are present in your data, if at all. More direct methods surely exist for identifying each specific problem individually; my suggestion would produce more of a quick-and-dirty omnibus effect size for those problems. If there's no difference (after correcting for the difference in scale), then one might argue there's no need to look further for problems that only apply to $$ . Si hay una diferencia sustancial, probablemente sea el momento de sacar la lupa para determinar la causa.

No estoy seguro de cómo se suele informar de los tamaños del efecto cuando se utiliza la prueba de Kendall. $$ (to the unfortunately limited extent that people worry about reporting effect sizes in general), but since it seems likely that unfamiliar readers would try to interpret it on the scale of Pearson's $ r$, it sería prudente informar de ambos su $$ statistic and its effect size on the scale of $ r$ utilizando la fórmula de conversión anterior... o al menos señalar la diferencia de escala y agradecer a Gilpin su práctica tabla de conversión.

Referencias

Foraita, R., y Sobotka, F. (2012). Validación de modelos gráficos. Paquete gmvalid, v1.23. Red integral de archivos R. URL: http://cran.r-project.org/web/packages/gmvalid/gmvalid.pdf

Gilpin, A. R. (1993). Table for conversion of Kendall's Tau to Spearman's Rho within the context measures of magnitude of effect for meta-analysis. Medición Educativa y Psicológica, 53 (1), 87-92.

Kendall, M. G. (1962). Métodos de correlación de rangos (3ª ed.). London: Griffin.

11voto

dan90266 Puntos 609

Todos ellos son buenos índices de asociación monótona. Spearman $\rho$ está relacionada con la probabilidad de concordancia mayoritaria entre tripletes aleatorios de observaciones, y $\tau$ (Kendall) y $\gamma$ (Goodman-Kruskal) están relacionadas con la concordancia entre pares. La principal decisión que hay que tomar al elegir $\gamma$ vs. $\tau$ es si quiere penalizar los empates en $X$ y/o $Y$ . $\gamma$ no penaliza los empates en ninguno de los dos, de modo que una comparación de la capacidad predictiva de $X_{1}$ et $X_{2}$ en la predicción $Y$ no recompensará a uno de los $X$ s por ser más continuos. Esta falta de recompensa hace que sea un poco incoherente con las pruebas de cociente de probabilidades basadas en modelos. En $X$ que está fuertemente ligado (digamos un binario $X$ ) pueden tener $\gamma$ .

2 votos

Frank, ¿puedes explicarlo Spearman's is related to the probability of majority concordance among random triplets of observations con más detalles, no muy difícil matemáticamente, si es posible? Gracias.

1 votos

Lo leí hace muchos años, probablemente en un texto de estadística no paramétrica. No he podido encontrar la referencia.

1 votos

Lamentable... :-( Porque la declaración en sí es muy intrigante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X