본문 바로가기
유도항법제어/비행제어

[DI-2] 내부 동역학 (Internal Dynamics)

by 깊은대학 2023. 1. 20.

다음과 같은 x(t)Rn, u(t)Rp, y(t)Rp 인 정방형 선형 시스템에 대해서

 

(1)x˙=Ax+Buy=Cx

 

DI(Dynamic Inversion, 모델 역변환) 제어입력은 다음과 같이 계산되었다.

 

(2)u=(CB)1(νCAx)

 

여기서 ν 는 보조입력(auxiliary input)이다.

 

 

 

식 (2)를 (1)에 대입하면 폐루프(closed-loop) 제어 시스템의 동역학을 얻을 수 있다.

 

(3)x˙=Ax+B(CB)1(νCAx)=[IB(CB)1C]Ax+B(CB)1ν=ADIx+BDIνy=Cx

 

DI 제어를 통해 폐루프 시스템의 동역학은 외부(νy) 루프와 내부(피드백 선형화) 루프로 분해된다.

 

내부 루프의 기능은 ν 부터 y 까지의 신호 흐름이 원점에 극점(pole)이 p 개 있는 적분기와 같게 만드는 것이다.

 

(4)y˙=CAx+CB(CB)1(νCAx)=ν

 

외부 루프는 νy 사이의 선형 관계로 구성되므로 출력 y 가 원하는 대로 동작하도록 입력 ν 를 설계하는 것은 쉽다. 가장 간단한 예로서

 

(5)ν=r˙+K(ry)=r˙+Ke

 

가 있었다. 여기서 r(t)r˙(t) 는 기준 응답과 그 변화율이다.

문제는 내부 동역학(internal dynamics)도 잘 작동하는지 여부, 즉 내부 상태가 안정(stable)한지 여부다. 제어기 설계는 전체 동역학을 고려해야 하므로 내부 동역학 또한 안정해야 한다. 내부 동역학이 불안정하다면 비록 추종오차가 0 이더라도 실질적으로 의미가 없는 제어기가 된다.

식 (3)에서 상태변수의 차원이 n 이고 오차 동역학의 차원이 p 이므로 행렬 ADI=[IB(CB)1C]A 의 고유값(eigenvalue)은 원점에 있는 p 개의 극점과 (np) 개의 내부 동역학 극점(pole) 구성되어 있다. 식 (3)과 (4)에서 오차 동역학은 안정화 시킬 수 있으므로, 즉 외부 루프 제어로 원점에 있는 p 개의 극점은 복소평면의 왼쪽 영역(LHP)으로 이동시킬 수 있으므로, 식 (4)로부터 기준 응답 변화율 r˙ 이 유한하다면 ν 도 유한하다. 따라서 시스템 (3)의 안정성은 내부 동역학의 극점의 위치 또는 내부 루프로 극점을 복소평면의 왼쪽 영역으로 이동시킬 수 있는 지에 달려있다.

입력-출력 관계에서 외부 루프의 극점만 있고 내부 동역학 극점이 보이지 않으므로 행렬 ADI 의 고유값 중에서 내부 동역학의 극점이 시스템 (1)의 전달 영점(transmission zero, MIMO 시스템의 영점)과 서로 상쇄(pole-zero cancelation)되었다는 것을 알 수 있다. 따라서 내부 운동 모드는 출력 y(t) 를 사용하여 관측할 수도 없고(unobservable) DI(동적 역변환) 접근법을 사용하여 제어할 수도 없는(uncontrollable) 모드다. 결국 내부 동역학의 극점은 이동시킬 수 없기 때문에 시스템 (1)의 전달 영점의 위치가 DI(동적 역변환) 제어 시스템의 안정성을 결정한다.

먼저 시스템 (1)의 전달 영점이 행렬 ADI 의 내부 동역학의 극점과 같다는 것을 증명해보자. 영점은 피드백 제어로 이동시킬 수 없기 때문에 시스템 (1)의 전달 영점은 시스템 (3)의 전달 영점과 같으므로 영점이 내부 동역학의 극점과 같다면 영점과 극점이 서로 상쇄되었다는 것이 증명된다.

 

 

 

원래 시스템 (1)의 전달 영점은 다음 식을 만족하는 s 값으로 정의된다.

 

(6)[sIABC0][x0u0]=[00],   [x0u0]0

 

여기서 벡터 x0u0 은 영점과 관련된 입력 방향을 나타낸다. 이 시스템은 D=0 이므로 극점보다 전달 영점 갯수가 적다. 위 정의에 의하면 벡터 x0 는 행렬 C 의 영공간(null space)에 있다는 것을 알 수 있다.

 

(7)(sIA)x0=Bu0Cx0=0

 

위 식의 첫번째 식에 행렬 C 를 곱하면 다음과 같이 된다.

 

(8)C(sIA)x0=CBu0u0=(CB)1(sCx0CAx0)=(CB)1CAx0

 

식 (8)을 (7)에 대입하면 다음과 같이 된다.

 

(9)(sIA)x0=B(CB)1CAx0(sI(I(B(CB)1C)A)x0=0  det(sIADI)=0

 

따라서 원래 시스템의 전달 영점은 모두 행렬 ADI 의 고유값이다. 그러나 이들은 전체 고유값 세트를 나타내지 않고 입력-출력 동역학에서 볼 수 없는 (np) 개의 모드만 나타낸다. 식 (9)에 의하면 원래 시스템의 전달 영점이 DI(동적 역변환)의 내부 동역학의 극점임을 보여준다. 따라서 원래 시스템이 비최소 위상(NMP, nonminimum phase) 시스템인 경우 DI 를 적용하면 NMP 영점에 해당하는 불안정 모드를 생성하게 된다.

따라서 DI(동적 역변환)가 성공적으로 작동하려면 내부 동역학이 안정적이도록 출력 또는 제어변수(controlled variable) y(t) 를 잘 선택해야 한다. 선택한 출력 행렬 C 에 대해 행렬 ADI 를 계산하고 고유값을 찾아 확인하여, 안정적이지 않으면 새로운 제어변수 y(t), 또는 행렬 C 를 다시 선택해야만 한다.

이번에는 내부 동역학의 모드가 관측할 수도 없고(unobservable) 제어할 수도 없는(uncontrollable) 모드라는 것을 증명해 보자. 행렬 P 를 다음과 같이 정의하면,

 

(10)P=IB(CB)1C

 

P2=P 이므로 P 는 투사(projection) 행렬이 된다. 또한

 

(11)PB=[IB(CB)1C]B=0CP=C[IB(CB)1C]=0

 

이므로 행렬 P 는 행렬 C 의 영공간(null space)으로 투사함(Pa=b  Cb=CPa=0) 과 동시에 제어입력 u(t) 가 운동 모드에 어떤 영향도 미치지 못하는 공간으로 투사하는 (PB=0  P(Bu)=0) 행렬이다. 따라서 ADI=PA 는 행렬 C 의 영공간에 있고 제어입력 u(t) 가 영향을 미치지 못하는 공간에서의 운동 모드를 갖는다. 이는 곧 제어할 수도 없고 관측할 수도 없는 모드를 의미한다.

비선형 시스템에서는 내부 동역학의 안정성을 결정하기 위해서 제로 동역학(zero dynamics)이라는 개념을 사용한다. 제로 동역학을 도입하는 이유는 내부 동역학의 안정성을 결정하는데 상대적으로 더 간단하기 때문이다. 제로 동역학은 시스템 출력이 입력에 의해 0 으로 유지될 때 시스템의 내부 동역학으로 정의된다. 선형 시스템의 제로 동역학을 구하기 위해 시스템 출력을 y=y˙=0 으로 놓으면 식 (4)에서 ν=0 이다. 따라서 식 (3)에 의하면 제로 동역학은 다음과 같다.

 

(12)x˙=[IB(CB)1C]Ax=ADIx

 

따라서 선형 시스템에서 제로 동역학의 안정성은 위에서 논한 바와 같이 행렬 ADI 의 고유값에 달려있다.

 

 

 

댓글