28 votos

Si la regresión lineal es relativa a la correlación de Pearson, hay técnicas de regresión relativa a la de Kendall y Spearman correlaciones?

Tal vez esta pregunta es ingenua, pero:

Si regresión lineal está estrechamente relacionado con el coeficiente de correlación de Pearson, hay técnicas de regresión estrechamente relacionada con la de Kendall y Spearman de correlación de los coeficientes?

27voto

AdamSane Puntos 1825

Hay una muy sencilla medios por los cuales el uso de casi cualquier medida de correlación para el ajuste de regresiones lineales, y que reproduce los mínimos cuadrados cuando se utiliza la correlación de Pearson.

Tenga en cuenta que si la pendiente de una relación es $\beta$, la correlación entre el $y-\beta x$ $x$ se debe esperar a ser $0$.

En efecto, si se tratara de cualquier otro de $0$, no estaría de algunos uncaptured relación lineal - que es lo que la correlación de medida podría ser recogida.

Por lo tanto, podríamos estimar la pendiente por la búsqueda de la pendiente, $\tilde{\beta}$ que hace el ejemplo de la correlación entre el$y-\tilde{\beta} x$$x$$0$. En muchos casos-por ejemplo, cuando se utiliza el rango de medidas basadas -- la correlación será un paso en función del valor de la pendiente de la estimación, de modo que puede haber un intervalo donde es cero. En ese caso, nosotros normalmente definir el presupuesto de la muestra a ser el centro del intervalo. A menudo la función de paso de saltos desde arriba de cero por debajo de cero en algún punto, y en caso de que la estimación está en el punto de salto.

Esta definición, por ejemplo, con toda la manera de clasificar y basados en correlaciones significativas. También puede ser utilizado para obtener un intervalo de la pendiente (de la manera habitual - por la búsqueda de las pistas que marca la frontera entre correlaciones significativas y simplemente insignificantes correlaciones).

Esto sólo define la pendiente, por supuesto, una vez que la pendiente es estimado, la intercepción puede estar basada en una ubicación adecuada estimación calculada sobre los residuos $y-\tilde{\beta}x$. Con la clasificación basada en las correlaciones de la mediana es una opción común, pero hay muchas otras opciones adecuadas.

Aquí está la correlación conspiraron en contra de la pendiente de la car datos en R:

enter image description here

La correlación de Pearson cruces 0 en el de los mínimos cuadrados pendiente, 3.932
Kendall correlación de las cruces 0 en el Theil-Sen pendiente, 3.667
La correlación de Spearman cruces 0 dando un "Lancero" la línea de la pendiente de 3.714

Esas son las tres de la pendiente de las estimaciones para nuestro ejemplo. Ahora necesitamos intercepta. Por simplicidad, sólo voy a utilizar la media residual de la primera y la intersección de la mediana para los otros dos (no importa mucho en este caso):

           intercept
 Pearson:  -17.573 *     
 Kendall:  -15.667
 Spearman: -16.285

*(la pequeña diferencia de cuadrados mínimos es debido al error de redondeo en la pendiente de la estimación; sin duda no hay similares error de redondeo en las otras estimaciones)

La correspondiente equipada líneas (utilizando el mismo esquema de color que el anterior) son:

enter image description here

Edit: Por comparación, el cuadrante de correlación pendiente es 3.333

Tanto el de correlación de Kendall y Spearman de correlación de las pendientes son mucho más robustos a los valores atípicos influyentes de los mínimos cuadrados. Vea aquí un ejemplo dramático en el caso de Kendall.

21voto

dan90266 Puntos 609

La parte proporcional de probabilidades (PO), el modelo se generaliza de Wilcoxon y el test de Kruskal-Wallis. Correlación de Spearman al $X$ es binario es la prueba estadística de Wilcoxon simplemente traducidos. Así que se podría decir que el PO es un modelo unificador método. Desde el PO modelo puede tener muchos intercepta como no son exclusivos de los valores de $Y$ (menos uno), se encarga tanto de la ordinales y continua $Y$.

El numerador de la partitura $\chi^2$ estadística en el PO modelo es exactamente la estadística de Wilcoxon.

El modelo de las op es un caso especial de una forma más general de la familia de probabilidad acumulativa (algunos la llaman acumulativa link) modelos, incluyendo el probit, de riesgos proporcionales, y log-log complementario modelos. Para un estudio de caso ver el Capítulo 15 de mi Folletos.

5voto

rankman Puntos 11

Aarón Han (1987 en econometría) propuso la Máxima Correlación por rangos estimador que se adapta a los modelos de regresión mediante la maximización de la proteína tau. Dougherty y Thomas (2012, en la literatura psicológica) ha propuesto recientemente una muy similar algoritmo. Hay una gran cantidad de trabajo en el MRC ilustrando sus propiedades.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X