4 votos

Encuentre un controlador para un sistema de control con un estado cúbico que minimice una función integral

He estado aprendiendo cómo resolver el problema de control óptimo de sistemas de la semana pasada y actualmente estoy trabajando en resolver este

$$\dot{x}=-x^3+u$$ donde $x(0)=1$. Encontrar $u$ con $t \in [0:\infty]$ que minimiza $$\int_0^\infty x^{2}+u^{2}dt$$

pero este problema me está dando un montón de problemas, porque el estado es cubicado cuando por lo general, no (al menos en los problemas a los que estoy acostumbrado). Puedo solucionar esto usando el Hamiltoniano con Euler-Lagrange o de la ecuación de Ricatti o hay otra más mejor enfoque?

¿Cuáles son las diferencias que deben tener en cuenta a la hora de resolver este tipo de problemas? Sería el proceso sería similar si la entrada fue también elevado a una potencia? También quiero agradecer a la comunidad por toda su ayuda. He estado aprendiendo mucho de aquí.

6voto

Kevin Puntos 11

Cuando la dinámica es no lineal (o de la función de costo en la integral no es sólo cuadrática) un buen punto de partida sería Pontryagin del máximo (o mínimo) principio (PMP), que es un enfoque Hamiltoniano. El general óptima de un problema de control que se PMP puede solucionar de la siguiente forma

$$ \min_{u(t)} \int_0^T g(t, x(t), u(t))\,dt + g_T(x(T)), \etiqueta{1} $$

con

$$ \dot{x} = f(t, x(t), u(t)), \quad x(0) = x_0. \etiqueta{2} $$

PMP estados que este problema puede ser resuelto con el Hamiltoniano

$$ H(t, x(t), u(t), \lambda(t)) = \lambda(t)^\la parte superior de f(t, x(t), u(t)) + g(t, x(t), u(t)), \etiqueta{3} $$

donde $\lambda(t)$ se llama la co-estado y tiene la misma dimensión como $x(t)$. La dinámica del sistema para que el control óptimo de la ley se aplica a puede ser expresado como el uso de

$$ \dot{\lambda}(t) = -\left[\frac{\partial}{\partial\,x} H(t, x(t), u(t), \lambda(t))\right]^\la parte superior, \etiqueta{4} $$

$$ \dot{x}(t) = \left[\frac{\partial}{\partial\,\lambda} H(t, x(t), u(t), \lambda(t))\right]^\la parte superior, \etiqueta{5} $$

$$ 0 = \frac{\partial}{\partial\,u} H(t, x(t), u(t), \lambda(t)). \etiqueta{6} $$

Se puede observar que, después de la sustitución de $(3)$ a $(5)$ obtener $(2)$ espalda. Si la entrada de $u(t)$ está restringido $(6)$ puede ser sustituido con resolución de $u(t)$ tal que el Hamiltoniano es mínimo, pero si $u(t)$ no está limitado y el Hamiltoniano es convexa en a$u(t)$ esto es equivalente a $(6)$. Si algunos (o todos) de los componentes del estado están limitados en el terminal, $x_i(T) = c_i$, las variables de $\lambda_i(T)$ puede ser elegido libremente. Pero si $x_j(T)$ es libre de $\lambda_j(T)$ será limitada, que se define por

$$ \lambda_j(T) = \left[\frac{\partial\,g_T(x)}{\parcial\,x}\right]^\top_{x = x(T)}. \etiqueta{7} $$


En su caso $f(t,x,u) = -x^3 + u$, $g(t,x,u) = x^2 + u^2$ e $g_T(x(T)) = 0$ que dar el siguiente Hamiltoniano cuando el uso de $(3)$

$$ H(x, u, \lambda) = \lambda(t)\,(-x^3 + u) + x^2 + u^2. \etiqueta{8} $$

Conectando a $(4)$ da

$$ \dot{\lambda} = x\,(3\,\lambda\,x - 2). \etiqueta{9} $$

Dado que no existen restricciones para $u$, lo $(5)$ puede ser utilizado

$$ \frac{\partial\,H}{\parcial\,u} = 2\,u + \lambda = 0, \etiqueta{10} $$

que los rendimientos de $u = -\tfrac{1}{2}\lambda$. Conectando a $f(t,x,u)$ permite utilizar para expresar el total de la dinámica de sistemas como

\begin{align} \dot{x} &= -x^3 - \frac{1}{2} \lambda, \tag{11a} \\ \dot{\lambda} &= x\,(3\,\lambda\,x - 2), \tag{11b} \end{align}

con $\lambda(T=\infty) = 0$, desde el $g_T = 0$. Aquí es donde las limitaciones de PMP venir, es decir, PMP no proporciona una manera general a través de la cual uno puede resolver fácilmente por $\lambda(0)$ y PMP es también normalmente no es ideal cuando se trata de con $T=\infty$. En orden para $\lambda(\infty) = 0$ también debe ser cierto que $\dot{\lambda}(\infty) = 0$, lo que combinado con $(11b)$ también implican $x(\infty) = 0$ (que también tiene sentido al considerar la función de costo).

En este caso he encontrado que es más fácil realizar una transformación de coordenadas, es decir, por la diferenciación $\dot{x}$ otro tiempo y que expresan $\lambda$ como una función de la $x$ e $\dot{x}$. Haciendo esto y la simplificación de las expresiones puede ser demostrado que el rendimiento de

$$ \ddot{x} = x + 3\,x^5, \etiqueta{12} $$

$$ \lambda = -2\left(\dot{x} + x^3\right). \etiqueta{13} $$

Así que ahora en lugar de encontrar el $\dot{x}(0)$ tal que $x(\infty)=0$. Se puede señalar que la $(12)$ es un segundo orden de la ecuación diferencial que sólo depende de la posición, de la que se puede definir la energía potencial negativo de la "fuerza" integrada por $x$. La energía total del sistema puede, por tanto, demostrado ser igual a

$$ E = \frac{1}{2} \dot{x}^2 - \frac{1}{2} x^2 (1 + x^4). \etiqueta{14} $$

Si el sistema se iría a la de origen ($x(\infty)=0$ e $\dot{x}(\infty)=0$) será necesario que la energía en el sistema sería cero $E=0$. La solución de $(14)$ set a cero para $\dot{x}$ da

$$ \dot{x} = \pm x\sqrt{1 + x^4}. \etiqueta{15} $$

Al determinar el signo de $\dot{x}$ puede razonarse que el sistema debe moverse hacia el origen, por lo que si $x$ es positivo $\dot{x}$ debe ser negativo y viceversa, por lo que el plus de signo debe ser siempre un signo menos. Esto ahora puede ser utilizado para encontrar la condición inicial para la co-estado mediante la combinación de $(13)$ con $(15)$

$$ \lambda(0) = -2\left(-x(0)\sqrt{1 + x(0)^4} + x(0)^3\right). \etiqueta{16} $$

Sin embargo $(12)$ e lo $(11)$ es inestable, por lo que pequeñas desviaciones en las condiciones iniciales, eventualmente, puede conducir a que el sistema iba a estallar. Por lo tanto, a menudo es mejor dar una política de control como una función del estado actual en lugar de sólo el estado inicial. Esto se puede hacer no sólo la evaluación de $(16)$ a $t=0$ pero también en todos los tiempos siguientes, sustituyendo esto en la solución de $u$ da el siguiente control óptimo de la política

$$ u = -x\sqrt{1 + x^4} + x^3. \etiqueta{17} $$

2voto

MachineLearner Puntos 342

Un enfoque alternativo a este problema se logra mediante el uso de programación dinámica y la de Hamilton-Jacobi-Bellman (HJB) la ecuación.

Nuestro problema es dada como una de restricciones ($u\in \mathbb{R}$) óptima de un problema de control con un horizonte infinito (el tiempo final $t_\text{f}$ es infinito).

Programación dinámica estados el problema sin restricciones horizonte infinito problema como

$$\text{min: } J = \dfrac{1}{2}\int_{t_0}^{\infty}\mathcal{L}(t,x,u)dt$$ $$\text{s.t.: } \dot{x}=f(t,x,u), x(t_0)=x_0.$$

  1. Paso: La solución puede ser obtenida mediante la resolución (sin restricciones de optimización)

$$\dfrac{d}{du}\left[\dfrac{1}{2}\mathcal{L}+\lambda f(t,x,u)\right]=0$$

para $u$ dependiendo $\lambda$.

  1. Paso: Conectar $u(\lambda)$ esta en HJB de horizonte infinito

$$\dfrac{1}{2}\mathcal{L}+\lambda f(t,x,u)=0.$$

  1. Paso: Resolver para $\lambda(x)$ Entonces $u(\lambda(x))=u(x)$ es el control óptimo.

Aplicado a este problema:

  1. Paso: Determinar El $u(\lambda)$ $$\dfrac{d}{du}\left[ \dfrac{1}{2}(x^2+u^2)+\lambda(-x^3+u)\right]=0 \implies u + \lambda = 0 \implies u = -\lambda.$$

  2. Paso: Determinar El $\lambda(x)$ $$\dfrac{1}{2}(x^2+u^2)+\lambda(-x^3+u)=0$$ $$\dfrac{1}{2}(x^2+\lambda^2)+\lambda(-x^3-\lambda)=0$$ $$\lambda^2+2x^3\lambda-x^2=0 \implies \lambda_{1,2}=-x^3\pm \sqrt{x^6+x^2}$$

  3. Paso: Determinar El $u(\lambda(x))=u(x)$ $$u=-\lambda \implies u(x) = x^3\mp \sqrt{x^6+x^2}$$

Tenemos dos soluciones resulta que $u(x) = x^3- \sqrt{x^6+x^2}$ es la solución correcta, debido a que $u(x) = x^3+\sqrt{x^6+x^2}$ va a llevar a un comportamiento inestable. Esta inestabilidad puede ser demostrado por $V(x) = \dfrac{1}{2}x^2$ como candidata de Lyapunov de la función. La solución con el signo menos es globalmente asintóticamente estable por el mismo Lyapunov función de candidato.


Este método no forzar $u$ a ser de cualquier tipo. También puede intentar el mismo procedimiento con los otros poderes de $u$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X