¿Cuál es la importancia de la distinción entre lineal y no lineal de los modelos? La pregunta no Lineal vs modelo lineal generalizado: ¿Cómo usted se refiere a la logística, de Poisson, etc. la regresión? y su respuesta fue muy útil la aclaración de la linealidad/no linealidad de los modelos lineales generalizados. Parece críticamente importante distinguir lineal de modelos no lineales, pero no está claro para mí por qué? Por ejemplo, considere estos modelos de regresión:
\begin{align} E[Y \mid X] & = \beta_0 + \beta_1 X \tag{1} \\ E[Y \mid X] & = \beta_0 + \beta_1 X + \beta_2 X^2 \tag{2} \\ E[Y \mid X] & = \beta_0 + \beta_1^2 X \tag{3} \\ E[Y \mid X] & = \{1+\exp(-[ \beta_0 + \beta_1 X]\}^{-1} \tag{4} \end{align}
Ambos Modelos 1 y 2 son lineales, y las soluciones a $\beta$ existen en forma cerrada, fácil de encontrar el uso de un estándar de MCO estimador. No así para los Modelos 3 y 4, que son no lineales, debido a que (algunos de) los derivados de la $E[Y\mid X]$ wrt $\beta$ todavía son funciones de $\beta$.
Una solución simple para la estimación de $\beta_1$ en el Modelo 3 es para linealizar el modelo mediante el establecimiento $\gamma = \beta_1^2$, calcular el $\gamma$ utilizando un modelo lineal, y, a continuación, calcular $\beta_1 = \sqrt{\gamma}$.
Para la estimación de los parámetros en el Modelo 4, podemos suponer $Y$ sigue una distribución binomial (miembro de la exponencial de la familia), y usando el hecho de que la logística forma de que el modelo es el enlace canónico, alinear el r.h.s. de la modelo. Este fue Nelder y Wedderburn la contribución seminal.
Pero, ¿por qué no linealidad de un problema en el primer lugar? Por qué no simplemente utilizar algún algoritmo iterativo para resolver el Modelo 3 sin alinear el uso de la función raíz cuadrada, o el Modelo 4 sin invocar GLMs. Sospecho que antes generalizada de la potencia de cálculo, los estadísticos estaban tratando de alinear todo. Si es cierto, entonces tal vez los "problemas", presentado por la no linealidad son un vestigio del pasado? Son las complicaciones introducidas por los no-lineal de los modelos meramente computacional, o hay alguna otra de las cuestiones teóricas que hacen de modelos no lineales más difícil ajuste a los datos de modelos lineales?