La banda gris es una banda de confianza para la recta de regresión. No estoy lo suficientemente familiarizado con ggplot2 segura de saber si es un 1 SE banda de confianza o un 95% de confianza de la banda, pero creo que es la antigua (Edit: evidentemente es un IC del 95%). Una banda de confianza proporciona una representación de la incertidumbre acerca de su línea de regresión. En un sentido, se puede pensar que la verdadera línea de regresión es tan alta como en la parte superior de esa banda tan bajos como los de la parte inferior, o la mueve de manera diferente dentro de la banda. (Tenga en cuenta que esta explicación está diseñado para ser intuitivo, y no es técnicamente correcto, pero totalmente correcta explicación es difícil para la mayoría de la gente a seguir.)
Usted debe utilizar la banda de confianza para ayudarle a entender y pensar sobre la línea de regresión. Usted no debe usar para pensar acerca de los datos en bruto de los puntos. Recuerde que la línea de regresión representa la media de $Y$ en cada punto en $X$ (si usted necesita para comprender esto mejor, puede ayudar a leer mi respuesta a esta pregunta: ¿Qué es la intuición detrás condicional de distribución Gausiana?). Por otro lado, que sin duda no esperar que todos los datos observados punto de ser igual a la media condicional. En otras palabras, usted no debe usar la banda de confianza para evaluar si un punto de datos es un valor atípico.
(Edit: esta nota es periférica a la pregunta principal, pero se trata de aclarar un punto para el OP.)
Un polinomio de regresión no es una regresión no lineal, aunque lo que se obtiene no se ve como una línea recta. El término "lineal" tiene un significado muy específico en un contexto matemático, específicamente, que los parámetros se estiman--las betas, son todos los coeficientes. Un polinomio de regresión sólo significa que su covariables son $X$, $X^2$, $X^3$, etc., es decir, que no tiene una relación lineal para cada uno de los otros, pero su betas son todavía los coeficientes, lo que es todavía un modelo lineal. Si su betas eran, digamos, exponentes, entonces usted tendría un modelo no lineal.
En suma, si es o no una línea de mira de frente no tiene nada que ver con si o no es un modelo lineal. Cuando se ajuste a un polinomio de modelo (con $X$$X^2$), el modelo no "saben" que, por ejemplo, $X_2$ es en realidad sólo el cuadrado de $X_1$. 'Piensa' estos son sólo dos variables (aunque se puede reconocer que hay algunos multicolinealidad). Por lo tanto, en verdad es apropiado (recta / plana) de regresión plano en el espacio tridimensional en lugar de una (curva) de la regresión de la línea en un espacio de dos dimensiones. Esto no es útil para nosotros, para pensar, y de hecho, muy difícil de ver desde $X^2$ es una perfecta función de $X$. Como resultado, no te molestes en pensar de esta manera y nuestras parcelas son en realidad dos dimensiones proyecciones en el $(X,\ Y)$ plano. Sin embargo, en el espacio correspondiente, la línea es en realidad "recto" en algún sentido.
Desde una perspectiva matemática, un modelo es lineal si los parámetros que están tratando de estimar son los coeficientes. Para aclarar aún más, considere la posibilidad de la comparación entre el estándar (OLS) modelo de regresión lineal, y un simple modelo de regresión logística se presenta en dos formas diferentes:
$$
Y = \beta_0 + \beta_1X + \varepsilon
$$
$$
\ln\left(\frac{\pi(Y)}{1 - \pi(Y)}\right) = \beta_0 + \beta_1X
$$
$$
\pi(Y) = \frac{\exp(\beta_0 + \beta_1X)}{1 + \exp(\beta_0 + \beta_1X)}
$$
El modelo superior es de regresión OLS, y las dos últimas son de regresión logística, aunque se presentan en diferentes formas. En los tres casos, cuando el ajuste del modelo, la estimación de la $\beta$s. Los dos primeros modelos son lineales, ya que todas las $\beta$s son los coeficientes, pero la parte inferior del modelo es no lineal (en este formulario) debido a que el $\beta$s son los exponentes. (Esto puede parecer muy extraño, pero la regresión logística es una instancia de la generalizada modelo lineal, ya que puede ser reescrito como un modelo lineal. Para obtener más información acerca de eso, puede ayudar a leer mi respuesta aquí: Diferencia entre los modelos logit y probit.)