12 votos

Es "bueno" para trazar una línea de regresión para datos ordenados (correlación de Spearman)?

Tengo los datos para que me calcula la correlación de Spearman y se desea visualizar para una publicación. La variable dependiente es clasificado, los independientes variable no es. Lo que quiero visualizar es más, la tendencia general de la real de la pendiente, así que clasificó a los independientes y aplicó la correlación de Spearman/regresión. Pero justo cuando tracé mis datos y estaba a punto de insertar en mi manuscrito, me topé con esta declaración (en esta web):

Casi nunca uso de una línea de regresión para la descripción o la predicción cuando haces rango de correlación de Spearman, por lo que no se calcula el equivalente de una línea de regresión.

y más tarde

Puedes gráfico de rango de correlación de Spearman de datos de la misma manera que lo haría para una regresión lineal o de correlación. No ponga una línea de regresión en el gráfico, sin embargo, sería engañoso para poner una línea de regresión lineal en un gráfico cuando se ha analizado con el rango de correlación.

La cosa es que, las líneas de regresión no son diferentes de cuando yo no clasificar a los independientes y calcular la correlación de Pearson. La tendencia es la misma, pero debido a los precios exorbitantes para los gráficos de colores en las revistas me fui con monocromo de la representación y de los puntos de datos reales se superponen tanto que no es reconocible.

Podría trabajar a mi manera de solucionar esto, por supuesto, por lo que dos parcelas diferentes: Uno para los datos de puntos (clasificado) y uno para la línea de regresión (sin ranking), pero si resulta que la fuente que he citado es incorrecta o que el problema no es que problemático en mi caso, haría mi vida más fácil. (Yo también vi a esta pregunta, pero no me ayudan.)

Editar para información adicional:

La variable independiente en el eje de las x representa el número de cuenta y la variable dependiente en el eje y representa el rango si algoritmos de clasificación cuando se comparan en su rendimiento. Ahora tengo algunos de los algoritmos que son comparables en promedio, pero lo que quiero decir con mi parcela es algo así como: "Mientras que Un clasificador pone mejor, el más características están presentes, clasificador B es mejor cuando menos características están presentes"

Edición 2 a incluir mi maquina:

Filas de los algoritmos trazan en función del número de características enter image description here

Filas de los algoritmos trazan en función del puesto número de características enter image description here

Así, a repetir la pregunta del título:

Está bien para trazar una línea de regresión para datos ordenados de Spearman de correlación/regresión?

10voto

AdamSane Puntos 1825

El grado de correlación puede ser utilizado para recoger monótona de asociación entre variables como nota; como tal, que normalmente no trazar una línea para que.

Hay situaciones en las que tiene sentido perfecto para utilizar rank-correlaciones con la realidad, las líneas de ajuste numérico-y vs numérico-x, si Kendall o de Spearman (o algún otro). Ver la discusión (y en particular, de la parcela) aquí.

Ese no es su situación, a pesar de que. En tu caso, yo estaría inclinado a sólo presentar un diagrama de dispersión (por ejemplo, por LOESS) de los datos originales, tal vez con una fluida relación (por ejemplo, por LOESS).

Se espera que la relación sea monótona; tal vez trate de calcular y trazar una relación monotónica. [Hay un R-función discutido aquí que puede caber isotónica de regresión, mientras que el ejemplo no es unimodal no isotónica, la función se puede hacer isotónica encaja.]

He aquí un ejemplo de a lo que me refiero:

enter image description here

La gráfica muestra una relación monotónica entre x y y; la curva roja es un loess suave (en este caso generado en R scatter.smooth), que también pasa a ser montonic (hay formas de obtener suave se adapta, que están garantizados para ser monótono, pero en este caso el valor predeterminado de loess suave era monótona, por lo que no sentía la necesidad de preocuparse.

enter image description here
Parcela de rango(y) vs rank(x), lo que indica una relación monotónica. La línea verde muestra las filas de los loess de la curva de los valores ajustados en contra de rango(x).

La correlación entre los rangos de x y de y (es decir, la correlación de Spearman) es 0.892 - un alto monotónica de la asociación. Del mismo modo, la correlación de Spearman entre el (montonic) provistos de loess-alisado de la curva ($\hat{y}$) y los valores es también 0.892. [Esto no es sorprendente, sin embargo, ya que sería aplicable a cualquier curva que es una monótona creciente de la función de x, que también corresponden a la línea verde. La línea verde no es una línea de regresión entre el rango(x) y el rango(y), pero se trata de la línea correspondiente a una monótona de ajuste en la trama original. La regresión de la línea' para el clasificado de datos tiene pendiente 0.892, no 1, así que es un poco "más plano".]

Si usted no está mostrando nada, pero de rango(Y) vs X, creo que me volvería a evitar el uso de líneas en las parcelas; por lo que puedo ver no, transmiten mucho de valor por encima del coeficiente de correlación. Y ya dijo que sólo estás interesado en la tendencia.

[No sé que es malo para trazar una línea de regresión en un clasificado-y vs clasificado-x de la parcela, la dificultad sería su interpretación.]

4voto

dan90266 Puntos 609

El uso de Spearman $\rho$ es equivalente a la parte proporcional de probabilidades modelo logístico ordinal si uno se para clasificar a los $X$ vector mientras que el modelado. El P. O. del modelo normalmente, los modelos $X$ en su escala original, y puede incluir términos no lineales. Para obtener predicciones, es ventajoso el uso de un enfoque basado en el modelo. Usted puede, por ejemplo, parcela de $X$ frente a la predicción de la media de $Y$ o previstos mediana $Y$ de los P. O. de ajuste del modelo. Ejemplos se encuentran en los folletos de http://biostat.mc.vanderbilt.edu/rms.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X