[Continuous-Time] 최소에너지 제어와 그래미안
다음과 같은 선형 시불변(LTI) 시스템이 있다.
\[ \dot{\mathbf{x}} =A \mathbf{x}+B \mathbf{u} \tag{1} \]
여기서 \(\mathbf{x}(t) \in \mathbb{R}^n\) 는 상태변수, \(\mathbf{u}(t) \in \mathbb{R}^p\) 는 제어입력이다. 방정식 (1)의 해는 다음과 같다.
\[ \mathbf{x}(t)=e^{At} \mathbf{x}(0)+ \int_0^t e^{A(t-\tau)} B \mathbf{u}(\tau) \ d \tau \tag{2} \]
이 시스템이 제어가능(controllable)하다면 유한 시간 \(t_1 \lt \infty\) 안에 임의의 초기 상태 \(\mathbf{x}(0)= \mathbf{x}_0\) 에서 임의의 목표 상태(target state) \(\mathbf{x}(t_1 )= \mathbf{x}_1\) 으로 시스템의 상태를 이동시키는 제어입력 \(\mathbf{u}(t)\) 가 존재한다. 만약 입력의 크기에 제약이 없다면 아주 짧은 시간에도 임의의 상태로 이동시킬 수 있지만 시간이 짧을 수록 제어입력의 크기는 커진다. 만약 입력의 크기에 제약이 있다면 주어진 시간 안에 목표 상태로 상태를 이동시키지 못할 수도 있다.
최소에너지 제어(minimal energy control)는 주어진 시간 \(t_1\) 동안 주어진 초기 상태 \(\mathbf{x}(0)= \mathbf{x}_0\) 에서 주어진 목표 상태 \(\mathbf{x}(t_1 )= \mathbf{x}_1\) 으로 시스템의 상태를 이동시킬 수 있는 제어입력 중에서 가장 작은 에너지를 사용하는 제어입력 \(\mathbf{u}^* (t)\) 로 정의한다. 즉,
\[ \int_0^{t_1} \mathbf{u}^T (t) \mathbf{u}(t) \ dt \ge \int_0^{t_1} \mathbf{u}^{*T} (t) \mathbf{u}^* (t) \ dt \tag{3} \]
최소에너지 제어는 다음과 같이 계산할 수 있다.
\[ \mathbf{u}^* (t)=B^T e^{A^T (t_1-t) } W_c^{-1} (t_1 ) \left[ \mathbf{x}_1-e^{At_1 } \mathbf{x}_0 \right] \tag{4} \]
여기서 \(W_c (t)\) 는 제어가능성 그래미안 (controllability gramian)으로서 다음과 같다.
\[ \begin{align} W_c (t) &= \int_0^t e^{A \tau} BB^T e^{A^T \tau} \ d \tau \tag{5} \\ \\ &= \int_0^t e^{A(t-s)} BB^T e^{A^T (t-s)} \ ds \end{align} \]
이를 증명해 보자. 우선 식 (4)를 (2)에 대입하면 \(\mathbf{x}(0)= \mathbf{x}_0\) 일 때 \(\mathbf{x}(t_1 )= \mathbf{x}_1\) 임을 확인할 수 있다.
이제 주어진 시간 \(t_1\) 동안 주어진 초기 상태 \(\mathbf{x}(0)= \mathbf{x}_0\) 에서 주어진 목표 상태 \(\mathbf{x}(t_1 )= \mathbf{x}_1\) 으로 시스템의 상태를 이동시킬 수 있는 또 다른 제어입력을 \(\mathbf{v}(t)\) 라고 하자. 그러면 다음 식이 성립한다.
\[ \begin{align} \mathbf{x}_1 & = e^{At_1 } \mathbf{x}_0+ \int_0^{t_1} e^{A(t_1-t)} B \mathbf{u}^* (t) \ dt \tag{6} \\ \\ \mathbf{x}_1 & = e^{At_1 } \mathbf{x}_0+ \int_0^{t_1} e^{A(t_1-t)} B \mathbf{v}(t) \ dt \end{align} \]
위 두 식을 뺴면 다음과 같다.
\[ \begin{align} 0=e^{At_1 } \int_0^{t_1} e^{-At} B \left[ \mathbf{v}(t)- \mathbf{u}^* (t) \right] \ dt \tag{7} \end{align} \]
위 식의 전치(transpose)는 다음과 같이 된다.
\[ \begin{align} 0= \int_0^{t_1} \left[ \mathbf{v}(t)- \mathbf{u}^* (t) \right]^T B^T e^{-A^T t} \ dt \tag{8} \end{align} \]
위 식의 양변에 \(W_c^{-1} (t_1 ) \left[ \mathbf{x}_1-e^{At_1 } \mathbf{x}_0 \right] \)를 곱하고 식 (4)를 대입하면 다음과 같다.
\[ \begin{align} 0 &= \int_0^{t_1} \left[ \mathbf{v}(t)- \mathbf{u}^* (t) \right]^T B^T e^{-A^T t} W_c^{-1} (t_1 ) \left[ \mathbf{x}_1-e^{At_1 } \mathbf{x}_0 \right] \ dt \tag{9} \\ \\ &= \int_0^{t_1} \left[ \mathbf{v}(t)- \mathbf{u}^* (t) \right]^T \mathbf{u}^* (t) \ dt \end{align} \]
여기서 다음 부등식을 이용하도록 한다.
\[ \begin{align} 0 & \le \int_0^{t_1} \left( \mathbf{v}(t)- \mathbf{u}^* (t) \right)^T \left( \mathbf{v}(t)-\mathbf{u}^* (t) \right) \ dt \tag{10} \\ \\ &= \int_0^{t_1} \mathbf{v}^T (t) \mathbf{v}(t) dt -2 \int_0^{t_1} \mathbf{v}^T (t) \mathbf{u}^* (t) \ dt + \int_0^{t_1} \mathbf{u}^{*T} (t) \mathbf{u}^* (t) \ dt \end{align} \]
식 (9)에 의하면
\[ \begin{align} \int_0^{t_1} \mathbf{v}^T (t) \mathbf{u}^* (t) \ dt = \int_0^{t_1} \mathbf{u}^{*T} (t) \mathbf{u}^* (t) \ dt \tag{11} \end{align} \]
이므로 위 식을 식 (10)에 대입하면 다음과 같다.
\[ \begin{align} \int_0^{t_1} \mathbf{v}^T (t) \mathbf{v}(t) \ dt -2 \int_0^{t_1} \mathbf{u}^{*T} (t) \mathbf{u}^* (t) \ dt + \int_0^{t_1} \mathbf{u}^{*T} (t) \mathbf{u}^* (t) \ dt \ge 0 \tag{12} \end{align} \]
따라서
\[ \begin{align} \int_0^{t_1} \mathbf{v}^T (t) \mathbf{v}(t) \ dt \ge \int_0^{t_1} \mathbf{u}^{*T} (t) \mathbf{u}^* (t) \ dt \end{align} \]
이 되므로 식 (4)로 주어지는 제어입력이 최소에너지 제어라는 것이 증명되었다.
최적제어 방법을 이용하여 증명할 수도 있다. 이 최소에너지 제어 문제는
\[ \begin{align} J = \frac{1}{2} \int_0^{t_1} \mathbf{u}^T(t) \mathbf{u} (t) \ dt \end{align} \]
를 최소화하는 제어입력을 계산하는 문제이므로, 고정최종상태 (fixed-final-state) LQR (https://pasus.tistory.com/258) 문제와 같다. 따라서 '고정최종상태 LQR 게시글'의 식 (14)와 (12)에서 \(R=I,\ t_f=t_1,\ t_0=0\) 으로 놓으면,
\[ \begin{align} \mathbf{u}^* (t)=B^T e^{A^T (t_1-t) } W_c^{-1} (t_1 ) \left[ \mathbf{x}_1-e^{At_1 } \mathbf{x}_0 \right] \end{align} \]
이 된다.
초기 상태가 \(\mathbf{x}(0)=0\) 이라면 시간 \(t\) 동안 상태 \(\mathbf{x}(t)= \mathbf{x}\) 까지 이동하는데 필요한 최소 제어 에너지는 식 (4)와 (5)를 이용하여 계산할 수 있다.
\[ \begin{align} \lVert \mathbf{u}^* \rVert^2 &= \int_0^t \mathbf{u}^{*T} (\tau) \mathbf{u}^* (\tau) \ d \tau \tag{13} \\ \\ &= \int_0^t \mathbf{x}^T W_c^{-1} (t) e^{A(t-\tau)} BB^T e^{A^T (t-\tau) } W_c^{-1} (t) \mathbf{x} \ dt \\ \\ &= \mathbf{x}^T W_c^{-1} (t) \int_0^t e^{A(t-\tau)} BB^T e^{A^T (t-\tau) } \ dt \ W_c^{-1} (t) \mathbf{x} \\ \\ &= \mathbf{x}^T W_c^{-1} (t) \mathbf{x} \end{align} \]
만약 시스템이 안정하다면, 무한 제어가능성 그래미안 \(W_c\)와 그래미안 \(W_c (t)\) 가 다음과 같은 관계를 가지므로 (https://pasus.tistory.com/340),
\[ \begin{align} W_c \ge W_c (t) \tag{14} \end{align} \]
최소 제어입력 에너지는 다음과 같이 된다.
\[ \begin{align} \lVert \mathbf{u}^* \rVert^2 = \mathbf{x}^T W_c^{-1} (t) \mathbf{x} \ge \mathbf{x}^T W_c^{-1} \mathbf{x} \tag{15} \end{align} \]
따라서 최소에너지 제어의 에너지 하한(lower bound)은 \(\mathbf{x}^T W_c^{-1} \mathbf{x}\) 로 주어진다.