5 votos

Transformaciones para Linealizar un Modelo en Regresión Lineal Múltiple. Decidir si un modelo es lineal, intrínsecamente lineal o no lineal.

Me piden que indique si un modelo es lineal. Si no lo es, tengo que encontrar una transformación adecuada. Pues bien, el modelo me parece extraño en el sentido de que no puedo imaginar dónde se produciría una situación así.

El modelo es,

$$Y_i = Ln(\beta_1X_{i1}) + \beta_2X_{i2} + \epsilon_i$$

Lo que no entiendo es cómo un modelo como este puede llegar a fructificar. A mí me parece que un analista de datos tenía un modelo lineal y cometió un error en la transformación. Pero, suponiendo que me equivoque y que este modelo pudiera derivarse de algún modo sin tomar explícitamente el logaritmo natural del primer término, ¿es posible volver a transformarlo adecuadamente? ¿Es adecuado exponenciar simplemente el primer término o tendríamos que exponenciar todo?

En resumen: ¿Es posible linealizar este modelo? En caso afirmativo, ¿cómo? Además, ¿puede aparecer un modelo como éste sin tomar manualmente el logaritmo natural del primer término?

3voto

jldugger Puntos 7490

Para explorar si un modelo es lineal en un elemento concreto, como por ejemplo $\beta_1$ (por ejemplo), adoptemos una notación que se centre en este elemento. Escriba

$$f(\theta) = \log(\theta X_{i1}) + \beta_2 X_{i2} + \epsilon_i,\tag{1}$$

suprimiendo así todas las demás variables y parámetros en la definición de $f$ y haciendo referencia genérica al parámetro $\beta_1$ como " $\theta.$ " Esto debería hacer obvio cómo el siguiente enfoque se aplica a cualquier parámetro para cualquier modelo.

Seamos claros sobre el objetivo.

Linealización $f$ significa que existe una transformación uno a uno $u,$ que convierte un nuevo parámetro $\gamma$ en el parámetro original $\theta=u(\gamma),$ para lo cual $g(\gamma)=f(u(\gamma))$ es una función lineal de $\gamma$ dondequiera que se defina.

Un significado bastante general de " $g$ es lineal" es que $g$ es diferenciable en un conjunto abierto que contiene su dominio y tiene una derivada constante $g^\prime.$ (Esta generalidad es realmente necesaria, porque muchos modelos estadísticos restringen algunos de sus parámetros. Por ejemplo, el parámetro $\sigma$ en la conocida Normal $(\mu,\sigma^2)$ de distribuciones suele estar limitada a $\sigma\gt 0.$ )

Este enfoque nos permite utilizar la maquinaria del Cálculo para decidir la cuestión de si $f$ puede linealizarse. Para aplicarla, solemos suponer que la reparametrización es a su vez diferenciable. La regla de la cadena implica $g$ es diferenciable. Sea $C$ nombrar la derivada constante (aún desconocida) de $g.$ La regla de la cadena también proporciona una fórmula para la derivada,

$$C=g^\prime(\gamma) = f^\prime(u(\gamma))\, u^\prime(\gamma).\tag{2}$$

(Tenga en cuenta que el modelo no está definido si $X_{i1}=0,$ por lo que podemos suponer que estos números son distintos de cero).

La fórmula original $(1)$ proporciona la información necesaria para diferenciar $f,$

$$f^\prime(\theta) = \frac{X_{i1}}{\theta X_{i1}} = \frac{1}{\theta}.$$

Combine esto con $(2)$ para obtener una ecuación para la reparametrización desconocida $u:$

$$u^\prime(\gamma) = \frac{C}{f^\prime(u(\gamma))} = C u(\gamma),\tag{3}$$

de donde

$$\frac{du}{u}\left(\gamma\right) = Cd\gamma$$

con solución general

$$\log\, \lvert \theta \rvert = \log\, \lvert u(\gamma) \rvert = C \gamma + C_0,$$

equivalente a

$$\theta = \pm e^{C\gamma + C_0}$$

para alguna constante adicional $C_0.$ El signo a elegir depende de si todos los $X_{i1}$ son positivos o todos son negativos. (El modelo no está definido si los signos de estas variables varían).

Para ser bastante explícitos, en el caso de que todos los $X_{i1}$ son positivos, podemos elegir $C=1$ y $C_0=0$ para que el modelo sea

$$Y_i = \gamma \log(X_{i1}) + \beta_2 X_{i2} + \epsilon_i;\quad \beta_1 = e^\gamma$$

y cuando todos los $X_{i1}$ son negativos, el modelo puede escribirse

$$Y_i = \gamma \log(-X_{i1}) + \beta_2 X_{i2} + \epsilon_i;\quad \beta_1=-e^\gamma.$$

Sin embargo, poder encontrar una solución explícita a $(3)$ no es importante para nosotros: la mera demostración de que hay existe algún basta con demostrar que $f$ es linealizable. Nótese, también, que no hace falta saber mucho de logaritmos para llegar a $(3),$ ni era necesario ser inteligente o tener algún tipo de perspicacia. El trabajo era puramente mecánico.


Para más información sobre los distintos significados de modelo "lineal", consulte mi artículo en https://stats.stackexchange.com/a/148713/919 .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X