Cuando la dinámica es no lineal (o de la función de costo en la integral no es sólo cuadrática) un buen punto de partida sería Pontryagin del máximo (o mínimo) principio (PMP), que es un enfoque Hamiltoniano. El general óptima de un problema de control que se PMP puede solucionar de la siguiente forma
$$
\min_{u(t)} \int_0^T g(t, x(t), u(t))\,dt + g_T(x(T)), \etiqueta{1}
$$
con
$$
\dot{x} = f(t, x(t), u(t)), \quad x(0) = x_0. \etiqueta{2}
$$
PMP estados que este problema puede ser resuelto con el Hamiltoniano
$$
H(t, x(t), u(t), \lambda(t)) = \lambda(t)^\la parte superior de f(t, x(t), u(t)) + g(t, x(t), u(t)), \etiqueta{3}
$$
donde $\lambda(t)$ se llama la co-estado y tiene la misma dimensión como $x(t)$. La dinámica del sistema para que el control óptimo de la ley se aplica a puede ser expresado como el uso de
$$
\dot{\lambda}(t) = -\left[\frac{\partial}{\partial\,x} H(t, x(t), u(t), \lambda(t))\right]^\la parte superior, \etiqueta{4}
$$
$$
\dot{x}(t) = \left[\frac{\partial}{\partial\,\lambda} H(t, x(t), u(t), \lambda(t))\right]^\la parte superior, \etiqueta{5}
$$
$$
0 = \frac{\partial}{\partial\,u} H(t, x(t), u(t), \lambda(t)). \etiqueta{6}
$$
Se puede observar que, después de la sustitución de $(3)$ a $(5)$ obtener $(2)$ espalda. Si la entrada de $u(t)$ está restringido $(6)$ puede ser sustituido con resolución de $u(t)$ tal que el Hamiltoniano es mínimo, pero si $u(t)$ no está limitado y el Hamiltoniano es convexa en a$u(t)$ esto es equivalente a $(6)$. Si algunos (o todos) de los componentes del estado están limitados en el terminal, $x_i(T) = c_i$, las variables de $\lambda_i(T)$ puede ser elegido libremente. Pero si $x_j(T)$ es libre de $\lambda_j(T)$ será limitada, que se define por
$$
\lambda_j(T) = \left[\frac{\partial\,g_T(x)}{\parcial\,x}\right]^\top_{x = x(T)}. \etiqueta{7}
$$
En su caso $f(t,x,u) = -x^3 + u$, $g(t,x,u) = x^2 + u^2$ e $g_T(x(T)) = 0$ que dar el siguiente Hamiltoniano cuando el uso de $(3)$
$$
H(x, u, \lambda) = \lambda(t)\,(-x^3 + u) + x^2 + u^2. \etiqueta{8}
$$
Conectando a $(4)$ da
$$
\dot{\lambda} = x\,(3\,\lambda\,x - 2). \etiqueta{9}
$$
Dado que no existen restricciones para $u$, lo $(5)$ puede ser utilizado
$$
\frac{\partial\,H}{\parcial\,u} = 2\,u + \lambda = 0, \etiqueta{10}
$$
que los rendimientos de $u = -\tfrac{1}{2}\lambda$. Conectando a $f(t,x,u)$ permite utilizar para expresar el total de la dinámica de sistemas como
\begin{align}
\dot{x} &= -x^3 - \frac{1}{2} \lambda, \tag{11a} \\
\dot{\lambda} &= x\,(3\,\lambda\,x - 2), \tag{11b}
\end{align}
con $\lambda(T=\infty) = 0$, desde el $g_T = 0$. Aquí es donde las limitaciones de PMP venir, es decir, PMP no proporciona una manera general a través de la cual uno puede resolver fácilmente por $\lambda(0)$ y PMP es también normalmente no es ideal cuando se trata de con $T=\infty$. En orden para $\lambda(\infty) = 0$ también debe ser cierto que $\dot{\lambda}(\infty) = 0$, lo que combinado con $(11b)$ también implican $x(\infty) = 0$ (que también tiene sentido al considerar la función de costo).
En este caso he encontrado que es más fácil realizar una transformación de coordenadas, es decir, por la diferenciación $\dot{x}$ otro tiempo y que expresan $\lambda$ como una función de la $x$ e $\dot{x}$. Haciendo esto y la simplificación de las expresiones puede ser demostrado que el rendimiento de
$$
\ddot{x} = x + 3\,x^5, \etiqueta{12}
$$
$$
\lambda = -2\left(\dot{x} + x^3\right). \etiqueta{13}
$$
Así que ahora en lugar de encontrar el $\dot{x}(0)$ tal que $x(\infty)=0$. Se puede señalar que la $(12)$ es un segundo orden de la ecuación diferencial que sólo depende de la posición, de la que se puede definir la energía potencial negativo de la "fuerza" integrada por $x$. La energía total del sistema puede, por tanto, demostrado ser igual a
$$
E = \frac{1}{2} \dot{x}^2 - \frac{1}{2} x^2 (1 + x^4). \etiqueta{14}
$$
Si el sistema se iría a la de origen ($x(\infty)=0$ e $\dot{x}(\infty)=0$) será necesario que la energía en el sistema sería cero $E=0$. La solución de $(14)$ set a cero para $\dot{x}$ da
$$
\dot{x} = \pm x\sqrt{1 + x^4}. \etiqueta{15}
$$
Al determinar el signo de $\dot{x}$ puede razonarse que el sistema debe moverse hacia el origen, por lo que si $x$ es positivo $\dot{x}$ debe ser negativo y viceversa, por lo que el plus de signo debe ser siempre un signo menos. Esto ahora puede ser utilizado para encontrar la condición inicial para la co-estado mediante la combinación de $(13)$ con $(15)$
$$
\lambda(0) = -2\left(-x(0)\sqrt{1 + x(0)^4} + x(0)^3\right). \etiqueta{16}
$$
Sin embargo $(12)$ e lo $(11)$ es inestable, por lo que pequeñas desviaciones en las condiciones iniciales, eventualmente, puede conducir a que el sistema iba a estallar. Por lo tanto, a menudo es mejor dar una política de control como una función del estado actual en lugar de sólo el estado inicial. Esto se puede hacer no sólo la evaluación de $(16)$ a $t=0$ pero también en todos los tiempos siguientes, sustituyendo esto en la solución de $u$ da el siguiente control óptimo de la política
$$
u = -x\sqrt{1 + x^4} + x^3. \etiqueta{17}
$$