Tengo los siguientes datos:
y x
1275 230
1350 235
1650 250
2000 277
3750 522
4222 545
5018 625
6125 713
6200 735
8150 820
9975 992
12200 1322
12750 1900
13014 2022
13275 2155
Me gustaría encontrar valores iniciales razonables para el modelo
$$y=\alpha+\beta_1\text{exp}(-\beta_2 e^{-\beta_3 x})+\epsilon$$
Lo que sé:
Para el modelo Gompertz, el punto de inflexión satisface
$$x=\frac{\text{log}(\beta_2)}{\beta_3}$$
Para el modelo Gompertz tenemos
$$\lim_{x\rightarrow\infty} \beta_1\text{exp}(-\beta_2 e^{-\beta_3 x})=\beta_1$$
así que presumiblemente con una intercepción tenemos
$$\lim_{x\rightarrow\infty} \alpha+\beta_1\text{exp}(-\beta_2 e^{-\beta_3 x})=\alpha+\beta_1$$
por lo que podemos establecer $\alpha+\beta_1=13275$ el valor máximo de $y$ en el conjunto de datos.
Sin embargo, no consigo combinar lo que sé para encontrar los valores iniciales.
Me gustaría encontrar valores iniciales razonables y no depender de la especificación de una parrilla exhaustiva de valores.
Se agradecerá cualquier idea o sugerencia.
Actualización:
Sigo leyendo wikipedia que el punto medio se encuentra
$${\displaystyle x_{\text{hwp}}=-{\frac {\ln\left(\frac{ln(2)}{\beta_2}\right)}{\beta_3}}}$$
Dejo que $x_{\text{hwp}}=713$ la mediana del $x$ 's.
Como ya he dicho, tengo $$x=\frac{\text{log}(\beta_2)}{\beta_3}$$
Dejo que $x=1000$ ya que un gráfico de los datos muestra que un posible punto de inflexión está alrededor de ahí.
Por software, este sistema de ecuaciones da como resultado $\beta_2=0.279$ y $\beta_3=-0.0013$ .
Decidí (al azar) dejar que $\alpha=13275$ y $\beta_1=-13275$ , donde $13275$ es el valor máximo de $y$ .
El modelo converge después de 15 iteraciones a
$$\hat{y}=12934.4-14349.2\cdot\text{exp}(-0.1214e^{0.00257x})$$
que están razonablemente cerca de mis estimaciones iniciales. No estoy seguro de por qué tendría sentido tener $\hat{\alpha}=13275$ y $\hat{\beta_1}=-13275$ sin embargo.