7 votos

¿Cómo puedo mostrar sin tendencia de los datos a partir de una regresión lineal?

Sólo estoy echando un vistazo a través de Hadley muy excelente libro sobre su ggplot2 paquete de R.

Él tiene algo de código para quitar una tendencia lineal en los diamantes conjunto de datos, así:

d <- subset(diamonds, carat < 2.5 & rbinom(nrow(diamonds), 1, 0.2) == 1)
d$lcarat <- log10(d$carat)
d$lprice <- log10(d$price)

detrend <- lm(lprice ~ lcarat, data = d)
d$lprice2 <- resid(detrend)

qplot(lcarat, lprice, data = d)
qplot(lcarat, lprice2, data = d)

Produce estos gráficos

Sin corregir...

enter image description here

Sin tendencia...

enter image description here

Me gustaría ver lo que los valores reales de lprice sería sin el efecto de lcarat. Trazado de los residuos vs lcarat muestra la forma correcta, pero los puntos se desplazan hacia y = 0 (mira en el rango del eje y unidades).

Para conseguir lo que quiero, ¿tiene sentido simplemente parcela de residuos + media(lprice)? es decir, desplazar el gráfico anterior hasta por media(lprice).

qplot(lcarat, lprice2 + mean(lprice), data = d)

enter image description here

¿Tiene sentido hacer esto? Hay un nombre para lo que yo estoy tratando de hacer?

7voto

ESRogs Puntos 1381

Como para mí, es terriblemente confuso, especialmente si usted puede hacer mucho más simple cosa-calcular price/carat a un precio de un quilate, que sería la manera más fácil de interpretar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X