본문 바로가기
유도항법제어/비행제어

[Continuous-Time] 관측가능성 (Observability)

by 깊은대학 2024. 7. 31.

다음과 같은 선형 시불변(LTI) 시스템이 있다.

 

(1)x˙=Ax+Buy=Cx+Du

 

여기서 x(t)Rn 는 상태변수, u(t)Rp 는 제어입력, y(t)Rq 는 제어입력이다.

만약 미지의 초기 상태 x(0) 에 대해 시간 범위 t[0, t1] 에서의 입력 u(t) 와 출력 y(t) 에 대한 정보를 바탕으로 초기 상태 x(0) 를 유일하게 결정하는데 충분한 유한 시간 t1>0 이 존재하는 경우 시스템 (1) 또는 행렬 (C,A) 는 관측가능(observable)하다고 정의한다.

 

 

LTI 시스템에서 상태변수는 제어입력에 영향을 받으며 차례로 출력에 영향을 미친다. 보통 상태 방정식으로 모델링된 시스템의 상태변수 차원이 제어입력 또는 출력의 차원보다 크다 (n>p, n>q). 이는 각 상태변수를 직접 작동시키거나 추정할 수 없다는 사실을 의미한다. 그럼에도 불구하고 상태변수를 추정해야할 필요가 있다.

관측가능성은 입력과 출력에 대한 지식으로 시스템의 내부 상태를 얼마나 잘 추정할 수 있는지를 측정하는 척도다. 왜냐하면 만약 입력 u(t) 와 출력 y(t) 를 이용하여 초기 상태 x(0) 를 유일하게 결정할 수 있다면 방정식 (1)로 주어지는 시스템의 전체 상태 궤적 x(t)를 계산할 수 있기 때문이다.

그렇다면 시스템이 이러한 관측 ‘능력’을 보유하고 있는지 아닌지 어떻게 판단할 수 있을까.

방정식 (1)의 해는 다음과 같다.

 

(2)y(t)=CeAtx(0)+C0teA(tτ)Bu(τ) dτ+Du(t)

 

여기서 입력 u(t) 와 출력 y(t) 를 알고 있다고 가정하면 초기 상태 x(0) 만이 미지수이므로 다음과 같이 쓸 수 있다.

 

(3)y~(t)=CeAtx(0)

여기서

y~(t)=y(t)C0teA(tτ)Bu(τ) dτDu(t)

 

는 알고 있는 값이다. 식 (3)에 의하면 결국 u(t)0 로 가정해도 관측가능성에 대한 해석적 결과는 동일하다.

 

(4)x˙=Axy=Cx

 

따라서 여기서는 시스템 (4)를 이용하여 관측가능성에 대해 논의하고자 한다.

관측가능성에 관련하여 다음 3가지 명제는 동치이다.

(a) (C,A)는 관측가능하다.

(b) 어떤 t1>0 에 대해서도 Wo(t1)>0 이다. 여기서 Wo 를 관측가능성 그래미안(observability gramian)이라고 하며 다음과 같이 정의한다.

 

(5)Wo(t1)=0t1eATtCTCeAt dt

 

(c) Qo 의 랭크(rank)는 n 이다. 여기서 Qo 를 관측가능성 행렬(observability matrix)이라고 하며 다음과 같이 정의한다.

 

(6)Qo=[CCACA2CAn1]

 

증명은 다음과 같다.

 

 

1. (c) (b)
‘(c) 이면 (b)다’라는 것을 직접 증명하기는 어려우므로 이와 동치인 ‘(b)가 아니면 (c)도 아니다’라는 명제를 대신 증명하겠다.
Wo(t1) 가 정정행렬(positive-definite matrix)이 아니라면 vTWo(t1)v=0 을 만족하는 어떤 벡터 v0 가 존재한다. 따라서

 

(7)0=vTWo(t1)v=vT(0t1eATtCTCeAt dt)v=0t1vTeATtCTCeAtv dt=0t1(CeAtv)T(CeAtv) dt=0t1CeAtv2 dt

 

이므로 모든 0tt1 에 대해서 CeAtv0 이 된다. 이는 곧 모든 시간 미분도 모든 시간 t 에서 항상 0 이 되어야 한다는 뜻이므로,

 

CeAtv=0      Cv=0CAeAtv=0      CAv=0CA2eAtv=0      CA2v=0       CAn1eAtv=0      CAn1v=0

 

가 된다. 따라서

 

[CCACA2CAn1]v=0=Qov

 

이므로 rank(Qo)<n 이 되어서 ‘(b)가 아니면 (c)도 아니다’ 라는 명제가 증명되었다.

2. (b) (c)
이번에도 ‘(b) 이면 (c)다’라는 것을 직접 증명하기는 어려우므로 이와 동치인 ‘(c)가 아니면 (b)도 아니다’라는 명제를 대신 증명하겠다.
만약 Qo 의 랭크(rank)가 n 이 아니라면 Qov=0 을 만족하는 어떤 벡터 v0 가 존재한다. 따라서

 

[CCACA2CAn1]v=0

 

이다. 케일리-해밀톤 정리(https://pasus.tistory.com/335)에 의하면

 

eAt=i=0n1βi(t)Ai

 

로 쓸 수 있으므로 다음 식이 성립한다.

 

CeAtv=i=0n1βi(t)CAiv=0

 

따라서

 

Wo(t1)v=(0t1eATtCTCeAt dt)v=0t1eATtCTCeAtv dt=0

 

이 되므로 Wo(t1) 는 정정행렬이 아니다.

3. (b) (a)
어떤 t1>0 에서 식 (4)의 해는 다음과 같다.

 

(8)y(t)=eAtx(0)

 

이제 다음 관계식을 보자.

 

0t1eATtCTy(t) dt=0t1eATtCTCeAt1x(0) dt=(0t1eATtCTCeAt dt)x(0)=Wo(t1)x(0)

 

위 식에 의하면

 

x(0)=Wo1(t1)0t1eATtCTy(t) dt

 

이 되므로 Wo(t1)>0 이면 시스템의 초기상태 x(0) 를 계산할 수 있다.

4. (a) (b)
이번에도 '(a) 이면 (b)다'라는 것을 직접 증명하기는 어려우므로 이와 동치인 '(b)가 아니면 (a)도 아니다'라는 명제를 대신 증명하겠다.
Wo(t1)>0 이 아니라면 vTWo(t1)v=0 을 만족하는 어떤 벡터 v0 가 존재한다. 따라서 식 (7)에 의하면 모든 0tt1 에 대해서 CeAtv0 이 된다. 그런데 만약 y(t)=CeAtx1(0) 이라면

 

y(t)=CeAt(x1(0)+v)=CeAtx2(0)

 

로 이 되므로 동일한 y(t) 에 대한 초기 상태가 유일하지 않기 때문에 시스템은 관측가능하지 않다.

(a) (c) 의 증명은 (a) (b) (c)의 순서로, (c) (a) 의 증명은 (c) (b) (a)의 순서로 증명하면 된다.

 

로 따라서 증명 1,2,3,4에 의해서 관측가능성에 관련한 3가지 명제가 동치임을 증명하였다. 보통 어떤 시스템이 관측가능한지의 여부는 식 (6)의 관측가능성 행렬의 랭크를 계산해서 확인한다.

댓글