Lo que se puede inferir a partir de este residuo de la trama?

Question

Lo que se puede inferir a partir de este residuo de la trama?

Preguntado el 5 de Marzo, 2016: Cuando se hizo la pregunta
154 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Esto es con referencia a http://analyticspro.org/2016/03/05/r-tutorial-residual-analysis-for-regression/.

Residual en el gráfico (b), donde los residuos están aumentando linealmente (con respecto a los valores pronosticados), podemos interpretar que nos estamos perdiendo de una variable? ¿Qué otra cosa es la interpretación?

Preguntado el 5 de Marzo, 2016 por arcyqwerty

Answer 1

1 Respuestas

Answer 2

10voto

jldugger Puntos 7490

La persona que produjo la parcela que cometió un error.

He aquí por qué. El ajuste de regresión de mínimos cuadrados ordinarios (incluyendo un término de intersección), que es donde las respuestas de $y_i$ se calcula como combinación lineal de los regresores las variables de $x_{ij}$ en forma

$$\hat y_i = \hat\beta_0 + \hat \beta_1 x_{i1} + \hat\beta_2 x_{i2} + \cdots + \hat\beta_p x_{ip}.$$

By definition, the residuals are the differences

$$e_i = y_i - \hat y_i.$$

The plot of $(\sombrero y_i, e_i)$ in the question shows a strong, consistent linear relationship. In other words, there are numbers $\hat\alpha_0$ and $\hat\alpha_1$--which we can find by fitting a line to the points in that plot--for which the values

$$f_i = e_i - (\hat\alpha_0 + \hat\alpha_1 \hat y_i)$$

are much closer to $0$ than the $e_i$ (in the sense of having much smaller sums of squares). But this says nothing other than that the revised estimates

$$\eqalign{ \hat {y}_i^\prime &= \hat {y}_i + \hat\alpha_0 + \hat\alpha_1 \hat y_i \\ y= (\hat\beta_0 + \hat\alpha_0) + (\hat\alpha_1\hat\beta_1) x_{i1} + \cdots + (\hat\alpha_1\hat\beta_p) x_{ip}\etiqueta{1} }$$

are better, in the least squares sense, than the original estimates, because their residuals are

$$y_i - \hat{y}_i^\prime = e_i - (\hat\alpha_0 + \hat\alpha_1 \hat y_i) = f_i.$$ But this is not possible, because in $(1)$, $\sombrero y_i^\prime$ ha sido escrito de forma explícita como una combinación lineal de las originales de regresores. Que significa esta nueva solución debe tener una menor suma de cuadrados de los residuos--lo que implica el ajuste original era no una solución válida.

Este resultado vale la pena llamar a un teorema:

Teorema: El de los mínimos cuadrados pendiente de la residual-vs-predijo parcela en una de mínimos Cuadrados Ordinarios del modelo es siempre cero.

Gráficos de residuos igual que en la pregunta sólo puede surgir cuando un modelo diferente se utiliza. Las dos situaciones más comunes son: (1) cuando el modelo no incluye el de interceptar y (2) el modelo no es lineal. El mecanismo en (1) se hace evidente cuando se mira un ejemplo:

Debido a que el modelo no incluye una intercepción, la equipada con línea debe pasar a través de $(0,0)$. Dado que los datos siguen una fuerte tendencia lineal que hace que no pasan a través de $(0,0)$, el modelo es pobre, el ajuste es malo, y lo mejor que se puede hacer es pasar la equipada con línea a través del baricentro de los puntos de datos. La tendencia en el residual de la parcela es precisamente la diferencia entre la pendiente de los puntos de datos y la pendiente de la línea roja a la izquierda.

En este caso, contrario a lo que sus estados de referencia, un modelo lineal es sin duda válido. El único problema es que este ajuste no pudo incluir un término de intersección.

Usted puede intentar este ejemplo por sí mismo mediante la variación de los parámetros en la R código que genera las figuras.

set.seed(17)
x <- seq(15, 6, length.out=50)            # Specify the x-values
y <- -20 + 4 * x + rnorm(length(x), sd=2) # Generate y-values with error
fit <- lm(y ~ x - 1)                      # Fit a no-intercept model

par(mfrow=c(1,2))                         # Prepare for two plots
plot(x,y, xlim=c(0, max(x)), ylim=c(0, max(y)), pch=16, main="Data and Fit")
abline(fit, col="Red", lwd=2, ltw=3)
plot(fit, which=1, pch=16, add.smooth=FALSE) # Residual-vs-predicted plot

Respondido el 5 de Marzo, 2016 por jldugger (7490 Puntos )

Lo que se puede inferir a partir de este residuo de la trama?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Lo que se puede inferir a partir de este residuo de la trama?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: