[Continuous-Time] 제어가능한 부분공간

깊은대학 2024. 7. 23. 12:02

다음과 같은 선형 시불변(LTI) 시스템이 있다.

$\begin{array}{r} (1) & \dot{x} = A x + B u \end{array}$

여기서 $x (t) \in R^{n}$ 는 상태변수, $u (t) \in R^{p}$ 는 제어입력이다. 이 시스템의 제어가능한 부분공간(controllable subspace) $χ_{c}$ 는 제어가능성 행렬(controllability matrix)의 레인지(range, 치역)로 정의한다.

$\begin{array}{r} (2) & χ_{c} = r a n g e (Q_{c}) \end{array}$

여기서 제어가능성 행렬 $Q_{c}$ 는 다음과 같이 정의한 바 있다 (https://pasus.tistory.com/336).

$\begin{array}{r} (3) & Q_{c} = [\begin{array}{c} B & A B & A^{2} B & \dots & A^{n - 1} B \end{array}] \in R^{n \times n p} \end{array}$

만약 상태벡터가 제어가능한 부분공간 어느 지점에서 시작하면 제어입력에 관계없이 상태벡터는 항상 제어가능한 부분공간에 머물러 있다. 즉, 제어입력은 제어가능한 부분공간 밖으로, 또는 제어불가능한 부분공간으로 상태를 이동시킬 수 없다.

증명은 다음과 같다.

방정식 (1)의 해는 다음과 같다.

$\begin{array}{r} (4) & x (t) = e^{A t} x (0) + \int_{0}^{t} e^{A (t - τ)} B u (τ) d τ \end{array}$

여기서 케일리-해밀톤 정리(https://pasus.tistory.com/335)에 의하면

$\begin{array}{r} (5) & e^{A (t - τ)} = \sum_{i = 0}^{n - 1} β_{i} (τ) A^{i} \end{array}$

로 놓을 수 있으므로, 시스템의 해 (4)는 다음과 같이 된다.

$\begin{aligned} (6) & x (t) - e^{A t} x (0) & = \int_{0}^{t} \sum_{i = 0}^{n - 1} β_{i} (τ) A^{i} B u (τ) d τ \\ = \sum_{i = 0}^{n - 1} A^{i} B w_{i} (t) \end{aligned}$

여기서 $w_{i} (t) = \int_{0}^{t} β_{i} (τ) u (τ) d τ$ 이다. 위 식에 의하면 $x (0)$ 가 $r a n g e (Q_{c})$ 안에 있으면 $x (t)$ 도 $r a n g e (Q_{c})$ 안에 머물러 있다. 만약 $r a n k (Q_{c}) = n$ 이라면 $n$ 차원 상태공간 전체가 제어가능한 공간이 되지만 $r a n k (Q_{c}) = n_{c} < n$ 이라면 $n_{c}$ 차원 제어가능한 부분공간과 $(n - n_{c})$ 차원의 제어불가능한 부분공간으로 분할할 수 있다.

증명은 다음과 같다.

변환행렬 $T$ 를 이용하여 상태변수 $x$ 를 상태변수 $\tilde{x}$ 로 변환한다.

$\begin{array}{r} (7) & x = T \tilde{x} \end{array}$

그러면 식 (1)은 다음과 같이 변환할 수 있다.

$\begin{array}{r} (8) & \dot{\tilde{x}} = \tilde{A} \tilde{x} + \tilde{B} \tilde{u} \end{array}$

여기서 $\tilde{A} = T^{- 1} A T, \tilde{B} = T^{- 1} B$ 이다. $A$ 와 $\tilde{A}$ 는 상사관계이므로 고유값은 서로 같다. 또한 시스템 (1)과 변환된 시스템 (8)의 제어가능성 특성은 동일하다. 확인해 보기 위해서 시스템 (8)의 제어가능성 행렬을 보면,

$\begin{aligned} {\tilde{Q}}_{c} & = [\begin{array}{c} \tilde{B} & \tilde{A} \tilde{B} & {\tilde{A}}^{2} \tilde{B} & \dots & {\tilde{A}}^{n - 1} \tilde{B} \end{array}] \\ = [\begin{array}{c} T^{- 1} B & T^{- 1} A B & T^{- 1} A^{2} B & \dots & T^{- 1} A^{n - 1} B \end{array}] \\ = T^{- 1} Q_{c} \end{aligned}$

이므로 $r a n k ({\tilde{Q}}_{c}) = r a n k (Q_{c})$ 이어서 제어가능성 특성이 동일하다.

식 (7)에서 변환행렬 $T$ 는 제어가능한 부분공간 $χ_{c}$ 에서 $n_{c}$ 개의 기저 벡터를 선택하고 나머지 $(n - n_{c})$ 개의 기저 벡터는 변환행렬 $T$ 가 직각행렬(orthogonal matrix, $T^{- 1} = T^{T}$ )이 되도록 선택하여 구성한다.

$\begin{aligned} (9) & T & = [\begin{array}{c} t_{1} & \dots & t_{n_{c}} & t_{n_{c} + 1} & \dots & t_{n} \end{array}] \\ = [\begin{array}{c} T_{1} & T_{2} \end{array}] \end{aligned}$

이러한 특징을 가진 변환행렬은 $Q_{c}$ 를 QR분해하거나 특이값 분해(singular value decomposition)해서 얻을 수 있는데 여기서는 특이값 분해(https://pasus.tistory.com/15)를 이용한다.

$\begin{aligned} (10) & Q_{c} & = U Σ V^{T} \\ = [\begin{array}{c} U_{1} & U_{2} \end{array}] [\begin{array}{c} Σ_{n_{c}} & 0 \\ 0 & 0 \end{array}] [\begin{array}{c} V_{1}^{T} \\ V_{2}^{T} \end{array}] \\ = [\begin{array}{c} U_{1} & U_{2} \end{array}] [\begin{array}{c} R \\ 0 \end{array}] \\ = U_{1} R \end{aligned}$

여기서 $U \in R^{n \times n}$ , $V \in R^{n p \times n p}$ , $Σ \in R^{n \times n p}$ , $U_{1} \in R^{n \times n_{c}}$ , $U_{2} \in R^{n \times (n - n_{c})}$ , $Σ_{n_{c}} \in R^{n_{c} \times n_{c}}$ , $R \in R^{n_{c} \times n p}$ 이다.

특이값 분해는 $U^{- 1} = U^{T}$ , $V^{- 1} = V^{T}$ 인 특징이 있으므로 $T = U$ 로 선택한다. 그러면 식 (8)을 다음과 같이 분해할 수 있다.

$\begin{array}{r} (11) & [\begin{array}{c} {\dot{x}}_{c} \\ {\dot{x}}_{u} \end{array}] = [\begin{array}{c} T_{1}^{T} A T_{1} & T_{1}^{T} A T_{2} \\ T_{2}^{T} A T_{1} & T_{2}^{T} A T_{2} \end{array}] [\begin{array}{c} x_{c} \\ x_{u} \end{array}] + [\begin{array}{c} T_{1}^{T} B \\ T_{2}^{T} B \end{array}] u \end{array}$

여기서 $\tilde{x} = [\begin{matrix} x_{c} \\ x_{u} \end{matrix}]$ 이다.

식 (10)에 의하면 $Q_{c} = [\begin{matrix} B & A B & \dots & A^{n - 1} B \end{matrix}] = T_{1} R$ 이므로 다음 식이 성립한다.

$\begin{aligned} (12) & B = T_{1} R_{1}, \\ A B = T_{1} R_{2}, \\ A^{2} B = T_{1} R_{3}, \\ \dots \\ A^{n - 1} B = T_{1} R_{n} \end{aligned}$

여기서 $R = [\begin{matrix} R_{1} & R_{2} & \dots & R_{n} \end{matrix}]$ 이다. 또한 식 (10)에 의하면 $T_{2}^{T} Q_{c} = T_{2}^{T} T_{1} R = 0$ 이다. 따라서

$\begin{aligned} (13) & T_{2}^{T} Q_{c} & = T_{2}^{T} [\begin{array}{c} B & A B A^{2} B & \dots & A^{n - 1} B \end{array}] \\ = [\begin{array}{c} T_{2}^{T} B & T_{2}^{T} A B & T_{2}^{T} A^{2} B & \dots & T_{2}^{T} A^{n - 1} B \end{array}] \\ = 0 \end{aligned}$

이다. 식 (12)를 이용하여 식 (13)의 각 항을 전개하면 다음과 같다.

$\begin{aligned} (14) & T_{2}^{T} B = 0 \\ T_{2}^{T} A B = T_{2}^{T} A T_{1} R_{1} = 0 \\ T_{2}^{T} A^{2} B = T_{2}^{T} A (A B) = T_{2}^{T} A T_{1} R_{2} = 0 \\ \dots \\ T_{2}^{T} A^{n - 1} B = T_{2}^{T} A T_{1} R_{n} = 0 \end{aligned}$

식 (14)에 의하면 $T_{2}^{T} A T_{1} [\begin{matrix} R_{1} & \dots & R_{n} \end{matrix}] = T_{2}^{T} A T_{1} R = 0$ 이므로 $T_{2}^{T} A T_{1} = 0$ 이다. 따라서 식 (11)은 다음과 같은 형식이 된다.

$\begin{array}{r} (15) & [\begin{array}{c} {\dot{x}}_{c} \\ {\dot{x}}_{u} \end{array}] = [\begin{array}{c} A_{c c} & A_{c u} \\ 0 & A_{u u} \end{array}] [\begin{array}{c} x_{c} \\ x_{u} \end{array}] + [\begin{array}{c} B_{c} \\ 0 \end{array}] u \end{array}$

여기서 $A_{c c} \in R^{n_{c} \times n_{c}}$ , $B_{c} \in R^{n_{c} \times p}$ 이다. 식 (15)에 의하면,

$\begin{array}{r} (16) & {\dot{x}}_{u} = A_{u u} x_{u} \end{array}$

이므로 상태변수 $x_{u}$ 는 제어입력의 영향을 전혀 받지 않기 때문에 제어불가능한 부분공간의 상태변수가 된다. 한편 식 (15)의 특성다항식은 다음과 같다.

$\begin{array}{r} (17) & det (λ I - \tilde{A}) = det (λ I - A_{c c}) det (λ I - A_{u u}) \end{array}$

따라서 시스템 (1)의 고유값 또는 $\tilde{A}$ 의 고유값은 $A_{c c}$ 의 고유값과 $A_{u u}$ 의 고유값의 합집합이라는 것을 알 수 있다. 여기서 $A_{u u}$ 의 고유값을 제어불가능한 고유값(uncontrollable eigenvalue)이라고 하고 그에 관련된 운동모드를 제어불가능한 모드라고 한다.

한편 제어불가능한 고유값이 모두 안정하다면 시스템 (1)을 또는 $(A, B)$ 를 안정화가능(stabilizable)한 시스템이라고 말한다. 달리 말하면 불안정한 고유값이 모두 제어가능하다면 안정화가능하다고 한다.

따라서 시스템이 제어가능하다면 안정화가능하다. 하지만 시스템이 안정화가능하다고 하여 제어가능한 것은 아니다.

한편 식 (15)에서 다음 일부 시스템을 제어가능 서브시스템(controllable subsystem)이라고 한다.

$\begin{array}{r} (18) & {\dot{x}}_{c} = A_{c c} x_{c} + B_{c} u \end{array}$

왜냐하면 $(A_{c c}, B_{c})$ 는 제어가능하기 떄문이다. 증명은 다음과 같다.

시스템 (15)의 제어가능성 행렬 ${\tilde{Q}}_{c}$ 의 랭크는 $n_{c}$ 이므로 다음과 같이 전개할 수 있다.

$\begin{aligned} n_{c} & = r a n k ({\tilde{Q}}_{c}) = r a n k [\tilde{B} \tilde{A} \tilde{B} {\tilde{A}}^{2} \tilde{B} \dots {\tilde{A}}^{n - 1} \tilde{B}] \\ = r a n k [\begin{array}{c} B_{c} & A_{c c} B_{c} & A_{c c}^{2} B_{c} & \dots & A_{c c}^{n - 1} B_{c} \\ 0 & 0 & 0 & \dots & 0 \end{array}] \\ = r a n k [B_{c} A_{c c} B_{c} A_{c c}^{2} B_{c} \dots A_{c c}^{n - 1} B_{c}] \end{aligned}$

따라서 서브 시스템 (18)은 제어가능하다.