Para explorar si un modelo es lineal en un elemento concreto, como por ejemplo $\beta_1$ (por ejemplo), adoptemos una notación que se centre en este elemento. Escriba
$$f(\theta) = \log(\theta X_{i1}) + \beta_2 X_{i2} + \epsilon_i,\tag{1}$$
suprimiendo así todas las demás variables y parámetros en la definición de $f$ y haciendo referencia genérica al parámetro $\beta_1$ como " $\theta.$ " Esto debería hacer obvio cómo el siguiente enfoque se aplica a cualquier parámetro para cualquier modelo.
Seamos claros sobre el objetivo.
Linealización $f$ significa que existe una transformación uno a uno $u,$ que convierte un nuevo parámetro $\gamma$ en el parámetro original $\theta=u(\gamma),$ para lo cual $g(\gamma)=f(u(\gamma))$ es una función lineal de $\gamma$ dondequiera que se defina.
Un significado bastante general de " $g$ es lineal" es que $g$ es diferenciable en un conjunto abierto que contiene su dominio y tiene una derivada constante $g^\prime.$ (Esta generalidad es realmente necesaria, porque muchos modelos estadísticos restringen algunos de sus parámetros. Por ejemplo, el parámetro $\sigma$ en la conocida Normal $(\mu,\sigma^2)$ de distribuciones suele estar limitada a $\sigma\gt 0.$ )
Este enfoque nos permite utilizar la maquinaria del Cálculo para decidir la cuestión de si $f$ puede linealizarse. Para aplicarla, solemos suponer que la reparametrización es a su vez diferenciable. La regla de la cadena implica $g$ es diferenciable. Sea $C$ nombrar la derivada constante (aún desconocida) de $g.$ La regla de la cadena también proporciona una fórmula para la derivada,
$$C=g^\prime(\gamma) = f^\prime(u(\gamma))\, u^\prime(\gamma).\tag{2}$$
(Tenga en cuenta que el modelo no está definido si $X_{i1}=0,$ por lo que podemos suponer que estos números son distintos de cero).
La fórmula original $(1)$ proporciona la información necesaria para diferenciar $f,$
$$f^\prime(\theta) = \frac{X_{i1}}{\theta X_{i1}} = \frac{1}{\theta}.$$
Combine esto con $(2)$ para obtener una ecuación para la reparametrización desconocida $u:$
$$u^\prime(\gamma) = \frac{C}{f^\prime(u(\gamma))} = C u(\gamma),\tag{3}$$
de donde
$$\frac{du}{u}\left(\gamma\right) = Cd\gamma$$
con solución general
$$\log\, \lvert \theta \rvert = \log\, \lvert u(\gamma) \rvert = C \gamma + C_0,$$
equivalente a
$$\theta = \pm e^{C\gamma + C_0}$$
para alguna constante adicional $C_0.$ El signo a elegir depende de si todos los $X_{i1}$ son positivos o todos son negativos. (El modelo no está definido si los signos de estas variables varían).
Para ser bastante explícitos, en el caso de que todos los $X_{i1}$ son positivos, podemos elegir $C=1$ y $C_0=0$ para que el modelo sea
$$Y_i = \gamma \log(X_{i1}) + \beta_2 X_{i2} + \epsilon_i;\quad \beta_1 = e^\gamma$$
y cuando todos los $X_{i1}$ son negativos, el modelo puede escribirse
$$Y_i = \gamma \log(-X_{i1}) + \beta_2 X_{i2} + \epsilon_i;\quad \beta_1=-e^\gamma.$$
Sin embargo, poder encontrar una solución explícita a $(3)$ no es importante para nosotros: la mera demostración de que hay existe algún basta con demostrar que $f$ es linealizable. Nótese, también, que no hace falta saber mucho de logaritmos para llegar a $(3),$ ni era necesario ser inteligente o tener algún tipo de perspicacia. El trabajo era puramente mecánico.
Para más información sobre los distintos significados de modelo "lineal", consulte mi artículo en https://stats.stackexchange.com/a/148713/919 .