@whuber ha dado una respuesta realmente excelente aquí. Sólo quiero añadir un pequeño punto complementario. La pregunta dice que "una relación lineal entre el predictor y los datos no es interpretable". Esto apunta a un malentendido común, aunque suelo escucharlo en el otro extremo ("¿cuál es la interpretación del término cuadrado [cúbico, etc.]?").
Cuando tenemos un modelo con múltiples diferentes covariables, cada [término] beta puede generalmente tener su propia interpretación. Por ejemplo, si
$$ \widehat{\text{GPA}}_{college}=\beta_0+\beta_1\text{GPA}_{highschool}+\beta_2\text{class rank}+\beta_3\text{SAT}, $$
(GPA significa promedio de calificaciones;
el rango es la ordenación del GPA de un estudiante en relación con otros estudiantes de la misma escuela secundaria; &
SAT significa "scholastic aptitude test" (prueba de aptitud académica), una prueba estándar de ámbito nacional para los estudiantes que van a la universidad)
entonces podemos asignar interpretaciones separadas a cada beta/término. Por ejemplo, si el GPA de un estudiante en la escuela secundaria fuera 1 punto más alto -si todo lo demás es igual- esperaríamos que su GPA en la universidad fuera $\beta_1$ puntos más altos.
Sin embargo, es importante señalar que no siempre es admisible interpretar un modelo de esta manera. Un caso obvio es cuando hay una interacción entre algunas de las variables, ya que no sería posible que el término individual difiriera y que todo lo demás se mantuviera constante; necesariamente, el término de la interacción también cambiaría. Por lo tanto, cuando hay una interacción, no interpretamos los efectos principales, sino sólo efectos simples como es bien sabido.
La situación con los términos de potencia es directamente análoga, pero desgraciadamente, no parece ser ampliamente comprendida. Consideremos el siguiente modelo:
$$ \hat{y}=\beta_0+\beta_1x+\beta_2x^2 $$ (En esta situación, $x$ pretende representar una covariable continua prototípica). No es posible que $x$ para cambiar sin $x^2$ cambiando también, y viceversa. En pocas palabras, cuando hay términos polinómicos en un modelo, los distintos términos basados en la misma covariable subyacente no se pueden interpretar por separado. El $x^2$ ( $x$ , $x^{17}$ etc.) no tiene ningún significado independiente. El hecho de que un $p$ -el término polinómico de potencia es "significativo" en un modelo indica que hay $p-1$ "curvas" en la función que relaciona $x$ y $y$ . Es desafortunado, pero inevitable, que cuando existe curvatura, la interpretación se complica y posiblemente es menos intuitiva. Para evaluar el cambio en $\hat{y}$ como $x$ cambios, tendremos que usar el cálculo. La derivada del modelo anterior es:
$$ \frac{dy}{dx}=\beta_1+2\beta_2x $$ que es la tasa de variación instantánea del valor esperado de $y$ como $x$ cambios, en igualdad de condiciones. Esto no es tan limpio como la interpretación del modelo superior; es importante que la tasa instantánea de cambio en $y$ depende del nivel de $x$ a partir del cual se evalúa el cambio . Además, la tasa de cambio de $y$ es una tasa instantánea, es decir, que cambia continuamente a lo largo del intervalo entre $x_{old}$ a $x_{new}$ . Esto es simplemente la naturaleza de una relación curvilínea.
5 votos
Creo que las respuestas a esto pregunta puede ser útil.
6 votos
Sí, estoy de acuerdo con Procrastinator, y las preguntas de interacción son esencialmente la misma consideración. Tenemos una algunas preguntas muy votadas sobre el tema. Además de la sugerencia de Pro, véase también ¿Todos los términos de las interacciones necesitan sus términos individuales en el modelo de regresión? y ¿Y si la interacción anula mis efectos directos en la regresión? .
0 votos
Gracias por el recordatorio de estas preguntas. De las respuestas dadas allí parece que es una estrategia aceptable si se tienen buenas razones a priori para incluir sólo el término cuadrático y no es errónea en sí misma. La pregunta que queda es la de la escalabilidad (ver: stats.stackexchange.com/a/27726/442 ). ¿Debo centrar mi variable antes del ajuste si sólo utilizo el término cuadrático?
1 votos
@Henrik - mi respuesta en el enlace que has puesto se refería a cómo la inferencia del modelo depende de cambios arbitrarios en los valores de los predictores (como el centrado de la media) - no es deseable que la conclusión sustantiva dependa de algo tan arbitrario, por lo que mi respuesta a tu pregunta es "no", por la misma razón.
2 votos
La cuestión de la cuadratura frente a la linealidad es lo suficientemente distinta conceptualmente de las interacciones como para pensar que esto no debería considerarse un duplicado.
0 votos
Un hilo relevante en SO: Ajuste de un modelo de regresión polinómica seleccionado por
leaps::regsubsets
con ejemplos en el software R