6 votos

Kendall tau cálculo

Puede alguien explicar cómo el de Kendall tau funciona? Me parece que no puede encontrar una buena explicación/tutorial/ejemplo. He estado corriendo corr(x,y,'kendall') de Matlab Estadísticas de la caja de herramientas, pero aparte de algunas de salida, no me da ninguna buena intuición. He estado recorriendo con el depurador, pero se vuelve confuso a veces. Sé que para que dos matrices, x y y debe tener el mismo número de filas, pero de eso se trata. Hay un ejemplo simple que iluminará lo que Kendall p-valor y Kendall tau realmente son?

3voto

Nameless Puntos 2331

Kendall $\tau$ le da un nonparameteric medida de correlación entre dos variables $x$$y$. No paramétrica aquí significa que la asociación entre el $x$ $y$ no tiene que ser, es decir, lineal (como con el coeficiente de correlación de Pearson).

Está dada por (ver el enlace de wikipedia arriba) $$\tau = \frac{(\text{number of concordant pairs}) - (\text{number of discordant pairs})}{\frac{1}{2} n (n-1) }.$$ Imagine que usted tiene $n$ observaciones de datos, que son tuplas $x_i,y_i$ de las dos variables. Tomar cualquiera de las dos posibles tuplas (pares), y si "ambos valores van en la misma dirección", entonces ellos son concordantes. Formalmente, para dos observaciones $i,j$ de las parejas son concordantes de la si $x_i>x_j$ $y_i>y_j$ o si $x_i<x_j$$y_i<y_j$. El numerador de la ecuación anterior sólo resta el número de pares concordantes del número de pares discordantes (al $x$ $y$ "ir en una dirección diferente"). El denominador es sólo una normalización, por lo que el $\tau$ siempre está en el intervalo de $[-1,1]$, como el coeficiente de correlación lineal.

La intuición en resumen: Kendall $\tau$ es el número de la observación de pares, donde ambas variables van en la misma dirección, menos el número de pares de observaciones donde ambas variables van en la dirección opuesta, dividido por el número de posibles parejas. Por lo tanto, la mayor de ambas variables van en la misma dirección, el mayor $\tau$.

2voto

tzar Puntos 23

Encontré este post y después de usar la de Kendall $\tau$ mucho en los últimos meses, aquí es un recurso que a mí me ayudó.

Spearman $\rho$ o R de Pearson medida de correlación lineal, pero la Tau de Kendall es mucho más parecido a un $\chi^2$ prueba en la que sólo se mide la fuerza de una relación. Es una especie de medida de monotonía; si los valores de x y de y "go" en la misma dirección con más frecuencia, a continuación, "ir" en diferentes direcciones, esperan un alto $\tau$.

Una vez que usted tiene un $\tau$ y un p-valor, usted puede pensar acerca de sus datos en la siguiente manera.

$P_c/P_d = (\tau+1)(\tau-1)$

Así que si usted tiene $\tau=0.6$, seleccionados al azar pares de $(x_i, y_i), (x_j, y_j)$ tienen 4 veces más probabilidades de ser concordantes de discordantes, o 4 veces más probabilidades de "ir" que "ir" de distancia. El p-valor da una medida (en el frecuentista perspectiva) ¿qué tan probable su $\tau$ es ser un falso positivo.

1voto

solusipse Puntos 145

Yo no puedo ayudar con los detalles específicos sobre el de Kendall tau rango de coeficiente de correlación, pero con respecto a la implementación en Matlab detalles, escriba edit corr en su ventana de comandos de Matlab. A continuación la ayuda que usted verá que estos

References:
   [1] Gibbons, J.D. (1985) Nonparametric Statistical Inference,
       2nd ed., M. Dekker.
   [2] Hollander, M. and D.A. Wolfe (1973) Nonparametric Statistical
       Methods, Wiley.
   [3] Kendall, M.G. (1970) Rank Correlation Methods, Griffin.
   [4] Best, D.J. and D.E. Roberts (1975) "Algorithm AS 89: The Upper
       Tail Probabilities of Spearman's rho", Applied Statistics,
       24:377-379.

y más abajo encontrarás estas explicaciones, que puede ser útil

Spearman's rho is equivalent to the linear (Pearson's) correlation
between ranks.  Kendall's tau is equivalent to the linear correlation
between the "concordances" sign(x(i)-x(j))*sign(y(i)-y(j)), i<j, with
an adjustment for ties.  This is often referred to as tau-b.

Kendall's tau-b is identical to the standard tau (or tau-a) when there
are no ties.  However, tau-b includes an adjustment for ties in the
normalizing constant.

Spearman's rho and Kendall's tau are discrete-valued statistics, and
their distributions have positive probability at 1 and -1.  For small
sample sizes, CORR uses the exact permutation distributions, and thus,
the on-diagonal p-values from CORR(X,X) in those cases.

When there are ties in the data, the null distribution of Spearman's
rho and Kendall's tau may not be symmetric.  Computing a two-tailed
p-value in such cases is not well-defined.  CORR computes p-values for
the two-tailed test by doubling the smaller of the one-tailed p-values.

Y, por supuesto, todo el código está disponible para leer...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X