본문 바로가기
유도항법제어/비행제어

[DI-2] 내부 동역학 (Internal Dynamics)

by 세인트 워터멜론 2023. 1. 20.

다음과 같은 \(\mathbf{x}(t) \in \mathbb{R}^n\), \(\mathbf{u}(t) \in \mathbb{R}^p\), \(\mathbf{y}(t) \in \mathbb{R}^p\) 인 정방형 선형 시스템에 대해서

 

\[ \begin{align} & \dot{\mathbf{x}} = A \mathbf{x}+B \mathbf{u} \tag{1} \\ \\ & \mathbf{y}=C \mathbf{x} \end{align} \]

 

DI(Dynamic Inversion, 모델 역변환) 제어입력은 다음과 같이 계산되었다.

 

\[ \mathbf{u}=(CB)^{-1} (\nu -CA \mathbf{x} ) \tag{2} \]

 

여기서 \(\nu\) 는 보조입력(auxiliary input)이다.

 

 

 

식 (2)를 (1)에 대입하면 폐루프(closed-loop) 제어 시스템의 동역학을 얻을 수 있다.

 

\[ \begin{align} \dot{\mathbf{x}} &= A \mathbf{x}+B(CB)^{-1} (\nu-CA \mathbf{x}) \tag{3} \\ \\ &=[I-B(CB)^{-1} C] A \mathbf{x}+B(CB)^{-1} \nu \\ \\ &=A_{DI} \mathbf{x}+B_{DI} \nu \\ \\ \mathbf{y} &=C \mathbf{x} \end{align} \]

 

DI 제어를 통해 폐루프 시스템의 동역학은 외부(\(\nu\) 와 \(\mathbf{y}\)) 루프와 내부(피드백 선형화) 루프로 분해된다.

 

내부 루프의 기능은 \(\nu\) 부터 \(\mathbf{y}\) 까지의 신호 흐름이 원점에 극점(pole)이 \(p\) 개 있는 적분기와 같게 만드는 것이다.

 

\[ \begin{align} \dot{\mathbf{y}} &= CA \mathbf{x}+CB(CB)^{-1} ( \nu -CA \mathbf{x}) \tag{4} \\ \\ &= \nu \end{align} \]

 

외부 루프는 \(\nu\) 와 \(\mathbf{y}\) 사이의 선형 관계로 구성되므로 출력 \(\mathbf{y}\) 가 원하는 대로 동작하도록 입력 \(\nu\) 를 설계하는 것은 쉽다. 가장 간단한 예로서

 

\[ \nu = \dot{\mathbf{r}}+K(\mathbf{r}-\mathbf{y})= \dot{\mathbf{r}}+K \mathbf{e} \tag{5} \]

 

가 있었다. 여기서 \(\mathbf{r}(t)\) 와 \(\dot{\mathbf{r}}(t)\) 는 기준 응답과 그 변화율이다.

문제는 내부 동역학(internal dynamics)도 잘 작동하는지 여부, 즉 내부 상태가 안정(stable)한지 여부다. 제어기 설계는 전체 동역학을 고려해야 하므로 내부 동역학 또한 안정해야 한다. 내부 동역학이 불안정하다면 비록 추종오차가 \(0\) 이더라도 실질적으로 의미가 없는 제어기가 된다.

식 (3)에서 상태변수의 차원이 \(n\) 이고 오차 동역학의 차원이 \(p\) 이므로 행렬 \(A_{DI}=[I-B(CB)^{-1} C] A\) 의 고유값(eigenvalue)은 원점에 있는 \(p\) 개의 극점과 \((n-p)\) 개의 내부 동역학 극점(pole) 구성되어 있다. 식 (3)과 (4)에서 오차 동역학은 안정화 시킬 수 있으므로, 즉 외부 루프 제어로 원점에 있는 \(p\) 개의 극점은 복소평면의 왼쪽 영역(LHP)으로 이동시킬 수 있으므로, 식 (4)로부터 기준 응답 변화율 \(\dot{\mathbf{r}}\) 이 유한하다면 \(\nu\) 도 유한하다. 따라서 시스템 (3)의 안정성은 내부 동역학의 극점의 위치 또는 내부 루프로 극점을 복소평면의 왼쪽 영역으로 이동시킬 수 있는 지에 달려있다.

입력-출력 관계에서 외부 루프의 극점만 있고 내부 동역학 극점이 보이지 않으므로 행렬 \(A_{DI}\) 의 고유값 중에서 내부 동역학의 극점이 시스템 (1)의 전달 영점(transmission zero, MIMO 시스템의 영점)과 서로 상쇄(pole-zero cancelation)되었다는 것을 알 수 있다. 따라서 내부 운동 모드는 출력 \(\mathbf{y}(t)\) 를 사용하여 관측할 수도 없고(unobservable) DI(동적 역변환) 접근법을 사용하여 제어할 수도 없는(uncontrollable) 모드다. 결국 내부 동역학의 극점은 이동시킬 수 없기 때문에 시스템 (1)의 전달 영점의 위치가 DI(동적 역변환) 제어 시스템의 안정성을 결정한다.

먼저 시스템 (1)의 전달 영점이 행렬 \(A_{DI}\) 의 내부 동역학의 극점과 같다는 것을 증명해보자. 영점은 피드백 제어로 이동시킬 수 없기 때문에 시스템 (1)의 전달 영점은 시스템 (3)의 전달 영점과 같으므로 영점이 내부 동역학의 극점과 같다면 영점과 극점이 서로 상쇄되었다는 것이 증명된다.

 

 

 

원래 시스템 (1)의 전달 영점은 다음 식을 만족하는 \(s\) 값으로 정의된다.

 

\[ \begin{bmatrix} sI-A & -B \\ C & 0 \end{bmatrix} \begin{bmatrix} \mathbf{x}_0 \\ \mathbf{u}_0 \end{bmatrix} =\begin{bmatrix} 0 \\ 0 \end{bmatrix}, \ \ \ \begin{bmatrix} \mathbf{x}_0 \\ \mathbf{u}_0 \end{bmatrix} \ne 0 \tag{6} \]

 

여기서 벡터 \(\mathbf{x}_0\) 및 \(\mathbf{u}_0\) 은 영점과 관련된 입력 방향을 나타낸다. 이 시스템은 \(D=0\) 이므로 극점보다 전달 영점 갯수가 적다. 위 정의에 의하면 벡터 \(\mathbf{x}_0\) 는 행렬 \(C\) 의 영공간(null space)에 있다는 것을 알 수 있다.

 

\[ \begin{align} & (sI-A) \mathbf{x}_0=B \mathbf{u}_0 \tag{7} \\ \\ & C \mathbf{x}_0=0 \end{align} \]

 

위 식의 첫번째 식에 행렬 \(C\) 를 곱하면 다음과 같이 된다.

 

\[ \begin{align} & C(sI-A) \mathbf{x}_0=CB \mathbf{u}_0 \tag{8} \\ \\ & \mathbf{u}_0=(CB)^{-1} (sC \mathbf{x}_0-CA \mathbf{x}_0 )= -(CB)^{-1} CA \mathbf{x}_0 \end{align} \]

 

식 (8)을 (7)에 대입하면 다음과 같이 된다.

 

\[ \begin{align} & (sI-A) \mathbf{x}_0=-B(CB)^{-1} CA \mathbf{x}_0 \tag{9} \\ \\ & \left( sI-(I-(B(CB)^{-1} C) A \right) \mathbf{x}_0=0 \\ \\ & \ \ \to det⁡(sI-A_{DI} )=0 \end{align} \]

 

따라서 원래 시스템의 전달 영점은 모두 행렬 \(A_{DI}\) 의 고유값이다. 그러나 이들은 전체 고유값 세트를 나타내지 않고 입력-출력 동역학에서 볼 수 없는 \((n-p)\) 개의 모드만 나타낸다. 식 (9)에 의하면 원래 시스템의 전달 영점이 DI(동적 역변환)의 내부 동역학의 극점임을 보여준다. 따라서 원래 시스템이 비최소 위상(NMP, nonminimum phase) 시스템인 경우 DI 를 적용하면 NMP 영점에 해당하는 불안정 모드를 생성하게 된다.

따라서 DI(동적 역변환)가 성공적으로 작동하려면 내부 동역학이 안정적이도록 출력 또는 제어변수(controlled variable) \(\mathbf{y}(t)\) 를 잘 선택해야 한다. 선택한 출력 행렬 \(C\) 에 대해 행렬 \(A_{DI}\) 를 계산하고 고유값을 찾아 확인하여, 안정적이지 않으면 새로운 제어변수 \(\mathbf{y}(t)\), 또는 행렬 \(C\) 를 다시 선택해야만 한다.

이번에는 내부 동역학의 모드가 관측할 수도 없고(unobservable) 제어할 수도 없는(uncontrollable) 모드라는 것을 증명해 보자. 행렬 \(P\) 를 다음과 같이 정의하면,

 

\[ P=I-B(CB)^{-1} C \tag{10} \]

 

\(P^2=P\) 이므로 \(P\) 는 투사(projection) 행렬이 된다. 또한

 

\[ \begin{align} & PB=[I-B(CB)^{-1} C] B=0 \tag{11} \\ \\ & CP=C[I-B(CB)^{-1} C]=0 \end{align} \]

 

이므로 행렬 \(P\) 는 행렬 \(C\) 의 영공간(null space)으로 투사함(\(P\mathbf{a}=\mathbf{b} \ \to \ C\mathbf{b}=CP\mathbf{a}=0\)) 과 동시에 제어입력 \(\mathbf{u}(t)\) 가 운동 모드에 어떤 영향도 미치지 못하는 공간으로 투사하는 (\(PB=0 \ \to \ P(B\mathbf{u})=0\)) 행렬이다. 따라서 \(A_{DI}=PA\) 는 행렬 \(C\) 의 영공간에 있고 제어입력 \(\mathbf{u}(t)\) 가 영향을 미치지 못하는 공간에서의 운동 모드를 갖는다. 이는 곧 제어할 수도 없고 관측할 수도 없는 모드를 의미한다.

비선형 시스템에서는 내부 동역학의 안정성을 결정하기 위해서 제로 동역학(zero dynamics)이라는 개념을 사용한다. 제로 동역학을 도입하는 이유는 내부 동역학의 안정성을 결정하는데 상대적으로 더 간단하기 때문이다. 제로 동역학은 시스템 출력이 입력에 의해 \(0\) 으로 유지될 때 시스템의 내부 동역학으로 정의된다. 선형 시스템의 제로 동역학을 구하기 위해 시스템 출력을 \(\mathbf{y}= \dot{\mathbf{y}}=0\) 으로 놓으면 식 (4)에서 \(\nu=0\) 이다. 따라서 식 (3)에 의하면 제로 동역학은 다음과 같다.

 

\[ \dot{\mathbf{x}} =[I-B(CB)^{-1} C]A \mathbf{x} =A_{DI} \mathbf{x} \tag{12} \]

 

따라서 선형 시스템에서 제로 동역학의 안정성은 위에서 논한 바와 같이 행렬 \(A_{DI}\) 의 고유값에 달려있다.

 

 

 

댓글