38 votos

¿Cómo diferenciar los modelos de regresión lineal y no lineal?

Estaba leyendo el siguiente enlace sobre la regresión no lineal SAS no lineal . Según he entendido al leer la primera sección "Regresión no lineal frente a regresión lineal", la ecuación que aparece a continuación es en realidad una regresión lineal, ¿es así? Si es así, ¿por qué?

$$y = b_1x^3 + b_2x^2 + b_3x + c$$

¿También debo entender que en la regresión no lineal la multicolinealidad no es un problema? Sé que la multicolinealidad puede ser un problema en la regresión lineal, así que seguramente si el modelo anterior es de hecho una regresión lineal habría multicolinealidad.

0 votos

Estrechamente relacionado: stats.stackexchange.com/questions/33876 .

0 votos

También relacionado: ¿Qué significa "curvilíneo"?

55voto

jldugger Puntos 7490

Hay (al menos) tres sentidos en los que una regresión puede considerarse "lineal". Para distinguirlos, empecemos con un modelo de regresión muy general

$$Y = f(X,\theta,\varepsilon).$$

Para simplificar la discusión, tomemos las variables independientes $X$ ser fijos y medidos con precisión (en lugar de variables aleatorias). Modelan $n$ observaciones de $p$ atributos cada uno, dando lugar a la $n$ -vector de respuestas $Y$ . Convencionalmente, $X$ se representa como un $n\times p$ matriz y $Y$ como columna $n$ -vectorial. El (finito $q$ -vectorial) $\theta$ comprende el parámetros . $\varepsilon$ es una variable aleatoria vectorial. Suele tener $n$ componentes, pero a veces tiene menos. La función $f$ es de valor vectorial (con $n$ componentes para que coincida con $Y$ ) y se suele suponer continua en sus dos últimos argumentos ( $\theta$ y $\varepsilon$ ).

El ejemplo arquetípico de ajustar una línea a $(x,y)$ datos, es el caso en el que $X$ es un vector de números $(x_i,\,i=1,2,\ldots,n)$ --los valores x; $Y$ es un vector paralelo de $n$ números $(y_i)$ ; $\theta = (\alpha,\beta)$ da el intercepto $\alpha$ y la pendiente $\beta$ y $\varepsilon = (\varepsilon_1,\varepsilon_2,\ldots,\varepsilon_n)$ es un vector de "errores aleatorios" cuyos componentes son independientes (y normalmente se supone que tienen distribuciones idénticas pero desconocidas de media cero). En la notación anterior,

$$y_i = \alpha + \beta x_i +\varepsilon_i = f(X,\theta,\varepsilon)_i$$

con $\theta = (\alpha,\beta)$ .

La función de regresión puede ser lineal en cualquiera (o en todos) sus tres argumentos:

  • "La regresión lineal, o un "modelo lineal", significa normalmente que $f$ es lineal en función del parámetros $\theta$ . El Significado SAS de "regresión no lineal" es en este sentido, con el supuesto añadido de que $f$ es diferenciable en su segundo argumento (los parámetros). Esta suposición facilita la búsqueda de soluciones.

  • Una "relación lineal entre $X$ y $Y$ " significa $f$ es lineal como función de $X$ .

  • Un modelo tiene errores aditivos cuando $f$ es lineal en $\varepsilon$ . En estos casos es siempre asumiendo que $\mathbb{E}(\varepsilon) = 0$ . (De lo contrario, no sería correcto pensar en $\varepsilon$ como "errores" o "desviaciones" de los valores "correctos").

Todas las combinaciones posibles de estas características pueden darse y son útiles. Hagamos un repaso de las posibilidades.

  1. Un modelo lineal de una relación lineal con errores aditivos. Se trata de una regresión ordinaria (múltiple), ya expuesta anteriormente y más generalmente escrita como

    $$Y = X\theta + \varepsilon.$$

    $X$ se ha aumentado, si es necesario, adjuntando una columna de constantes, y $\theta$ es un $p$ -vector.

  2. Un modelo lineal de una relación no lineal con errores aditivos. Esto se puede plantear como una regresión múltiple aumentando las columnas de $X$ con funciones no lineales de $X$ mismo. Por ejemplo,

    $$y_i = \alpha + \beta x_i^2 + \varepsilon$$

    es de esta forma. Es lineal en $\theta=(\alpha,\beta)$ tiene errores aditivos; y es lineal en los valores $(1,x_i^2)$ aunque $x_i^2$ es una función no lineal de $x_i$ .

  3. Un modelo lineal de una relación lineal con errores no aditivos. Un ejemplo es el error multiplicativo,

    $$y_i = (\alpha + \beta x_i)\varepsilon_i.$$

    (En estos casos el $\varepsilon_i$ pueden interpretarse como "errores multiplicativos" cuando la ubicación de $\varepsilon_i$ es $1$ . Sin embargo, el sentido propio de la ubicación no es necesariamente la expectativa $\mathbb{E}(\varepsilon_i)$ más: puede ser la mediana o la media geométrica, por ejemplo. Se aplica un comentario similar sobre los supuestos de localización, mutatis mutandis en todos los demás contextos que no sean de error aditivo).

  4. Un modelo lineal de una relación no lineal con errores no aditivos. Por ejemplo ,

    $$y_i = (\alpha + \beta x_i^2)\varepsilon_i.$$

  5. Un modelo no lineal de una relación lineal con errores aditivos. Un modelo no lineal implica combinaciones de sus parámetros que no sólo son no lineales, ni siquiera se pueden linealizar reexpresando los parámetros.

    • Como No es un ejemplo, considere

      $$y_i = \alpha\beta + \beta^2 x_i + \varepsilon_i.$$

      Al definir $\alpha^\prime = \alpha\beta$ y $\beta^\prime=\beta^2$ y restringiendo $\beta^\prime \ge 0$ este modelo se puede reescribir

      $$y_i = \alpha^\prime + \beta^\prime x_i + \varepsilon_i,$$

      exhibiéndolo como un modelo lineal (de una relación lineal con errores aditivos).

    • Como ejemplo, considere

      $$y_i = \alpha + \alpha^2 x_i + \varepsilon_i.$$

      Es imposible encontrar un nuevo parámetro $\alpha^\prime$ , en función de $\alpha$ que lo linealizará en función de $\alpha^\prime$ (manteniéndolo lineal en $x_i$ también).

  6. Un modelo no lineal de una relación no lineal con errores aditivos.

    $$y_i = \alpha + \alpha^2 x_i^2 + \varepsilon_i.$$

  7. Un modelo no lineal de una relación lineal con errores no aditivos.

    $$y_i = (\alpha + \alpha^2 x_i)\varepsilon_i.$$

  8. Un modelo no lineal de una relación no lineal con errores no aditivos.

    $$y_i = (\alpha + \alpha^2 x_i^2)\varepsilon_i.$$


Aunque estos presentan ocho formularios de regresión, no constituyen una sistema de clasificación porque algunas formas pueden convertirse en otras. Un ejemplo estándar es la conversión de un modelo lineal con errores no aditivos (se supone que tiene soporte positivo)

$$y_i = (\alpha + \beta x_i)\varepsilon_i$$

en un modelo lineal de una relación no lineal con errores aditivos a través del logaritmo, $$\log(y_i) = \mu_i + \log(\alpha + \beta x_i) + (\log(\varepsilon_i) - \mu_i)$$

Aquí, la media geométrica logarítmica $\mu_i = \mathbb{E}\left(\log(\varepsilon_i)\right)$ se ha eliminado de los términos de error (para garantizar que tengan medias cero, como es necesario) y se ha incorporado a los demás términos (donde habrá que estimar su valor). De hecho, una de las principales razones para reexpresar la variable dependiente $Y$ es crear un modelo con errores aditivos. La reexpresión también puede linealizar $Y$ en función de alguno (o ambos) de los parámetros y las variables explicativas.


Colinealidad

Colinealidad (de los vectores columna en $X$ ) puede ser un problema en cualquier forma de regresión. La clave para entender esto es reconocer que la colinealidad conduce a dificultades en la estimación de los parámetros. De forma abstracta y bastante general, comparar dos modelos $Y = f(X,\theta,\varepsilon)$ y $Y=f(X^\prime,\theta,\varepsilon^\prime)$ donde $X^\prime$ es $X$ con una columna ligeramente modificada. Si esto induce enormes cambios en el estimaciones $\hat\theta$ y $\hat\theta^\prime$ entonces es obvio que tenemos un problema. Una de las formas en que puede surgir este problema es en un modelo lineal, lineal en $X$ (es decir, los tipos (1) o (5) anteriores), donde los componentes de $\theta$ están en correspondencia uno a uno con las columnas de $X$ . Cuando una columna es una combinación lineal no trivial de las demás, la estimación de su parámetro correspondiente puede ser cualquier número real. Este es un ejemplo extremo de dicha sensibilidad.

Desde este punto de vista, debe quedar claro que la colinealidad es un problema potencial para los modelos lineales de relaciones no lineales (independientemente de la aditividad de los errores) y que este concepto generalizado de colinealidad es potencialmente un problema en cualquier modelo de regresión. Cuando se tienen variables redundantes, habrá problemas para identificar algunos parámetros.

0 votos

¿puede recomendarme una lectura introductoria y concisa que me ayude a entender mejor la linealización que menciona, que es el meollo de la diferencia entre su ejemplo y el no ejemplo del punto 5? Muchas gracias.

0 votos

@Color No conozco ninguno. Bajo suposiciones suaves sobre la diferenciabilidad de las posibles transformaciones, esto es abordado por la teoría de Ecuaciones Diferenciales Parciales (EDP).

5voto

ColorStatistics Puntos 110

Un modelo es lineal si es lineal en los parámetros o puede transformarse para ser lineal en los parámetros (linealizable). Los modelos lineales pueden modelar relaciones lineales o no lineales. Vamos a ampliar cada uno de ellos.

Un modelo es lineal en parámetros si puede escribirse como la suma de términos, donde cada término es una constante o un parámetro que multiplica un predictor (X i ):

enter image description here

Tenga en cuenta que esta definición es muy limitada. Sólo los modelos que cumplen esta definición son lineales. Todos los demás modelos son no lineales.

Hay dos tipos de modelos lineales que se confunden con los modelos no lineales:

1. Modelos lineales de relaciones no lineales

Por ejemplo, el modelo siguiente modela una relación no lineal (porque la derivada de Y con respecto a X 1 es una función de X 1 ). Creando una nueva variable W 1 \=X 1 2 y reescribiendo la ecuación con W 1 sustituyendo a X 1 2 tenemos una ecuación que satisface la definición de modelo lineal.

enter image description here

2. Modelos que no son inmediatamente lineales pero que pueden convertirse en lineales tras una transformación (linealizables). A continuación se muestran 2 ejemplos de modelos linealizables:

Ejemplo 1:

enter image description here

Este modelo puede parecer no lineal porque no cumple con la definición de un modelo lineal en parámetros, sin embargo, puede transformarse en un modelo lineal, por lo que es linealizable/transformable, y por lo tanto se considera un modelo lineal. Las siguientes transformaciones lo linealizarían. Comience por tomar el logaritmo natural de ambos lados para obtener:

enter image description here

entonces haga las siguientes sustituciones:

enter image description here

para obtener el modelo lineal siguiente:

enter image description here

Ejemplo 2:

enter image description here

Este modelo puede parecer no lineal porque no cumple con la definición de un modelo lineal en parámetros, sin embargo, puede transformarse en un modelo lineal, por lo que es linealizable/transformable, y por lo tanto se considera un modelo lineal. Las siguientes transformaciones lo linealizarían. Comience por tomar el recíproco de ambos lados para obtener:

enter image description here

entonces haga las siguientes sustituciones:

enter image description here

para obtener el modelo lineal siguiente:

enter image description here

Cualquier modelo que no sea lineal (ni siquiera mediante linealización) es no lineal. Piénsalo así: Si un modelo no cumple la definición de modelo lineal, entonces es un modelo no lineal, a menos que se pueda demostrar que es linealizable, en cuyo caso se gana el derecho a ser llamado modelo lineal.

La respuesta de Whuber más arriba, así como la de Glen_b en este enlace, darán más color a mi respuesta. Modelo no lineal frente a modelo lineal generalizado: ¿Cómo se refiere a la regresión logística, de Poisson, etc.?

0voto

Pranab Puntos 116

Deberías empezar ahora mismo por diferenciar la realidad del modelo que utilizas para describirla

La ecuación que acabas de mencionar es una ecuación polinómica (x^poder), es decir, no lineal... pero aún así puedes modelarla usando un modelo lineal generlizado (usando una función de enlace) o una regresión polinómica ya que los parámetros son lineales (b1, b2, b3, c)

espero que haya servido de ayuda, la verdad es que es un poco imprecisa : realidad/modelo

3 votos

Puede estimarse mediante mínimos cuadrados ordinarios, ya que el modelo es lineal en los parámetros.

0 votos

¿así que todo tiene que ver con los parámetros? ¿si b3^2 * x seguiría siendo lineal?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X