다음과 같이 이산시간(discrete-time) 차분 방정식(difference equation)으로 표현된 비선형 시스템이 있다.
여기서 아래 첨자
최적제어 문제는 시스템이 어떤 스칼라 목적함수를 최소화하도록 제어변수를 결정하는 문제이다. 목적함수는 상태변수와 제어변수에 관한 비용함수(cost function)로 주어지는 것이 일반적이다.
여기서
최종 상태변수 제약조건은 최종 상태변수와 최종시간의 함수로서 다음과 같이 주어진다.
여기서
최적제어는 시간 구간
목적함수는 설계자가 의도한대로 시스템을 움직이면서 의도한 성능을 발휘할 수 있도록 구성해야 한다. 최적제어란 단지 목적함수를 최소화하는 제어입력을 의미하는 것이지 시스템의 동작이 설계자가 원하는 대로 이상적으로 움직이게 한다는 뜻이 아니다. 따라서 목적함수를 최소화하면 시스템이 설계자가 원하는 대로 움직이거나 성능이 고도화되도록 잘 선정할 필요가 있다. 실제 문제에서는 여러 가지 목적함수를 바꿔가면서 최적제어를 설계하고 시뮬레이션을 통해서 설계자가 의도한 대로 시스템이 반응하는지 확인하는 작업을 반복하여 수행한다.

최적제어 문제는 제약조건이 있는 최적화 문제이므로 라그랑지 곱수(Lagrange multiplier)를 도입하여 동역학식과 제약조건을 목적함수에 포함시킨다. 라그랑지 곱수
여기서 동역학 제약조건(즉, 시스템 운동 모델)이 매 시간스텝마다 존재하기 때문에 라그랑지 곱수도 매 시간마다 필요하다. 라그랑지 곱수가
변경된 목적함수
식 (5)에서 세번째 줄은 다음과 같이 바꿀 수 있다.
한편, 식 (5)에서 맨 마지막 줄은 다음과 같이 바꿀 수 있으므로,
식 (5)는 다음과 같이 된다.
따라서
식 (9)는 시스템의 동역학인 상태변수 차분 방정식이고, 식 (10)은 라그랑지 곱수의 차분 방정식으로서 코스테이트(costate) 방정식이라고 한다. 식 (11)은 정정조건(stationary condition)이라고 한다. 이 식으로부터 최적 제어변수를 계산할 수 있다. 최종 상태변수 제약조건은 식 (12)에 있다.
위 식에서 주목할 점은 라그랑지 곱수에 관한 식 (10)이다. 상태변수 식 (9)가 정방향(forward) 시간 식이라면, 라그랑지 곱수 식은 시간적으로 역방향(backward) 식이다. 라그랑지 곱수도 차분 운동 방정식에 의해 결정되므로 코스테이트라고 한다. 상태변수 식은 초기 상태변수가
식 (13)과 (14)는 각각 상태변수의 최종값과 초기값에 관한 식으로서 경계조건 식이라고 한다. 보통 상태변수 초기값은 정해져 있으므로
경계조건은 최종시간이 설정된(fixed) 값으로 주어지는지 아닌지, 그리고 초기 및 최종 상태변수가 설정된 값으로 주어지는지 아닌지에 따라 다양하게 적용할 수 있다. 만약 최종시간이 미리 설정된 값으로 주어진다면 위 식에서
'유도항법제어 > 최적제어' 카테고리의 다른 글
변분법과 오일러-라그랑지 방정식 (0) | 2021.01.12 |
---|---|
변분법 (calculus of variation) (0) | 2021.01.11 |
브라키스토크론 문제와 변분법 (0) | 2021.01.08 |
[Discrete-Time] 자유최종상태 (Free-final-state) LQR (1) | 2020.10.31 |
[Discrete-Time] LQR 문제 (0) | 2020.10.31 |
댓글