본문 바로가기
유도항법제어/비행제어

[Continuous-Time] 관측가능성과 제어가능성의 관계

by 깊은대학 2024. 8. 1.

다음과 같은 선형 시불변(LTI) 시스템이 있다.

 

\[ \begin{align} \dot{\mathbf{x}} &=A \mathbf{x}+B \mathbf{u} \tag{1} \\ \\ \mathbf{y} &=C \mathbf{x}+D \mathbf{u} \end{align}\]

 

여기서 \(\mathbf{x}(t) \in \mathbb{R}^n\) 는 상태변수, \(\mathbf{u}(t) \in \mathbb{R}^p\) 는 제어입력, \(\mathbf{y}(t) \in \mathbb{R}^q\) 는 출력이다.

주요 제어가능성(controllability) 정리의 의하면 시스템 \((A, B)\) 가 제어가능하기 위한 필요충분 조건은 제어가능성 행렬 \(Q_c\) 의 랭크(rank)가 \(n\) 인 경우이다 (https://pasus.tistory.com/336).

 

\[ \begin{align} rank(Q_c) =rank \ [B \ \ AB \ \ A^2 B \ \ \cdots \ \ A^{n-1} B]=n \tag{2} \end{align}\]

 

여기서 어떤 행렬 \(M\) 에 대해서 \(rank(M)=rank(M^T )\) 이므로 위 식은 다음과 같이 쓸 수 있다.

 

\[ \begin{align} rank(Q_c^T ) =rank \begin{bmatrix} B^T \\ B^T A^T \\ B^T A^{T2} \\ \vdots \\ B^T A^{T(n-1)} \end{bmatrix} =n \tag{3} \end{align}\]

 

여기서 유의할 점은 위 식의 행렬은 시스템 \((B^T, A^T)\) 와 관련된 관측가능성 행렬이라는 것이다 (https://pasus.tistory.com/342). 따라서 주요 관측가능성(observability) 정리를 상기하면 다음과 같은 결과를 얻을 수 있다.

1. \((A, B)\) 가 제어가능한 것과 \((B^T, A^T)\) 가 관측가능한 것은 동치이다.
2. \((C, A)\) 가 관측가능한 것과 \((A^T, C^T)\) 가 제어가능한 것은 동치이다.

이것이 의미하는 바는 제어가능성과 관측가능성은 서로 듀얼관계 (duality)를 갖는다는 것이다. 이런 듀얼관계를 이용하면 관측가능성과 관련된 많은 명제들의 증명을 쉽게 할 수 있다. 몇가지를 증명없이 나열하고자 한다.

 

 

1. 만약 관측가능성 행렬의 랭크가 \(rank(Q_o )=n_o \lt n\) 이라면 \(n_o\) 차원 관측가능한 부분공간과 \((n-n_o)\) 차원의 관측불가능한 부분공간으로 분할할 수 있다. 또한 시스템을 다음과 같은 구조로 변환하는 변환행렬 \(T\) 가 존재한다.

 

\[ \begin{align} \begin{bmatrix} \dot{\mathbf{x}}_o \\ \dot{\mathbf{x}}_u \end{bmatrix} & = \begin{bmatrix} A_{oo} & 0 \\ A_{uo} & A_{uu} \end{bmatrix} \begin{bmatrix} \mathbf{x}_o \\ \mathbf{x}_u \end{bmatrix}+ \begin{bmatrix} B_o \\ B_u \end{bmatrix} \mathbf{u} \tag{4} \\ \\ \mathbf{y} &= \begin{bmatrix} C_o & 0 \end{bmatrix} \begin{bmatrix} \mathbf{x}_o \\ \mathbf{x}_u \end{bmatrix}+D \mathbf{u} \end{align}\]

 

여기서 \(\mathbf{x}=T \begin{bmatrix} \mathbf{x}_o \\ \mathbf{x}_u \end{bmatrix}\), \( A_{oo} \in \mathbb{R}^{n_o \times n_o }\), \(C_o \in \mathbb{R}^{p \times n_o }\) 이다. 식 (4)에 의하면 상태변수 \(\mathbf{x}_u\) 는 시스템의 출력 \(\mathbf{y}\) 에 전혀 반영이 되지 않기 때문에 관측불가능한 부분공간의 상태변수가 된다. 한편 식 (4)에서 다음 일부 시스템을 관측가능 서브시스템(observable subsystem)이라고 한다.

 

\[ \begin{align} \dot{\mathbf{x}}_o &= A_{oo} \mathbf{x}_o+B_o \mathbf{u} \tag{5} \\ \\ \mathbf{y} &= C_o \mathbf{x}_o+D \mathbf{u} \end{align}\]

 

여기서 \((C_o, A_{oo} )\) 는 관측가능하다. 또한 식 (4)의 특성다항식은 다음과 같다.

 

\[ \begin{align} \det⁡ (\lambda I-A) = \det (\lambda I-A_{oo} ) \det (\lambda I-A_{uu} ) \tag{6} \end{align}\]

 

따라서 시스템 (1)의 고유값은 \(A_{oo}\) 의 고유값과 \(A_{uu}\) 의 고유값의 합집합이라는 것을 알 수 있다. 여기서 \(A_{uu}\) 의 고유값을 관측불가능한 고유값(unobservable eigenvalue)이라고 하고 그에 관련된 운동모드를 관측불가능한 모드라고 한다.

관측불가능한 고유값이 모두 안정하다면 시스템 (1)을 또는 \( (C, A)\) 를 검출가능(detectable)한 시스템이라고 말한다. 달리 말하면 불안정한 고유값이 모두 관측가능하다면 검출가능하다고 한다.

식 (4)에서 변환행렬 \(T\) 는 관측가능성 행렬 \(Q_o\) 를 특이값 분해(singular value decomposition)해서 얻을 수 있다.

 

\[ \begin{align} Q_o=U \Sigma V^T \tag{7} \end{align}\]

 

여기서 \(U \in \mathbb{R}^{nq \times nq}\), \(V \in \mathbb{R}^{n \times n}\), \(\Sigma \in \mathbb{R}^{nq \times n}\)이고 \(T=V\) 로 선택한다.

 

 

2. PBH 테스트(Popov-Belevitch-Hautus test)에 의하면, 어떤 복소수 \(\lambda \) 가 다음 랭크 조건을 만족한다면 시스템 \((C, A)\) 의 관측불가능한 고유값이다.

 

\[ \begin{align} rank \begin{bmatrix} \lambda I-A \\ C \end{bmatrix} \lt n \tag{8} \end{align}\]

 

3. 시스템 \((C, A)\) 의 관측가능성 그래미안(observability gramian) \(W_o\) 는 다음과 같다.

 

\[ \begin{align} W_o (t)= \int_0^t e^{A^T \tau } C^T Ce^{A \tau} \ d \tau \tag{9} \end{align}\]

 

식 (9)의 그래미안 행렬은 다음 미분방정식의 해다.

 

\[ \begin{align} \dot{W}_o (t)=A^T W_o+W_o A+C^T C, \ \ \ \ \ W_o (0)=0 \tag{10} \end{align}\]

 

만약 \(A\) 가 안정하다면 무한(infinite) 관측가능성 행렬은 다음과 같고,

 

\[ \begin{align} W_o = \int_0^\infty e^{A^T t} C^T Ce^{A t} \ d t \tag{11} \end{align}\]

 

\(W_o\) 는 다음 대수 방정식의 해다.

 

\[ \begin{align} A^T W_o+W_o A+C^T C =0 \tag{12} \end{align}\]

 

또한 무한 관측가능성 그래미안 \(W_o \gt 0\) 은 안정한 시스템 \((C, A)\) 의 관측가능성 필요충분 조건이다.

시스템 \((C, A)\) 가 관측가능한 경우, 무한 관측가능성 그래미안과 유한 그래미안의 관계는 다음과 같다.

 

\[ \begin{align} W_o \ge W_o (t) \tag{13} \end{align}\]

 

4. 초기 상태가 \(\mathbf{x}(0)= \mathbf{x}\) 가 산출하는 출력은 \(\mathbf{y}(t)=Ce^{At} \mathbf{x}\) 이므로 에너지는 다음과 같이 계산할 수 있다.

 

\[ \begin{align} \lVert \mathbf{y} \rVert^2 &= \int_0^t \mathbf{y}^T (\tau) \mathbf{y}(\tau) \ d \tau \tag{14} \\ \\ &= \int_0^t \mathbf{x}^T e^{A^T \tau } C^T Ce^{A\tau} \mathbf{x} \ dt \\ \\ &= \mathbf{x}^T W_o (t) \mathbf{x} \end{align}\]

 

이 에너지를 관측 에너지라고 한다. 만약 시스템이 안정하다면, 식 (13)에 의해서 식 (14)는 다음과 같이 된다.

 

\[ \begin{align} \lVert \mathbf{y} \rVert^2=\mathbf{x}^T W_o (t) \mathbf{x} \le \mathbf{x}^T W_o \mathbf{x} \end{align}\]

 

따라서 초기 상태 \(\mathbf{x}(0)= \mathbf{x}\) 가 산출하는 관측 에너지의 상한(upper bound)은 \(\mathbf{x}^T W_o \mathbf{x}\) 가 된다.

댓글