다음과 같은 선형 시스템이 있다.
이 시스템의 초기 시간
이 시스템의 목적함수도 다음과 같이 고정된 시간 구간
여기서
이 문제를 풀기 위해 먼저 해밀토니안 (Hamiltonian) 함수를 정의한다.
여기서
최적제어의 필요조건을 정리한 표에 의하면 다음과 같이 상태변수와 코스테이트(costate) 미분 방정식을 얻을 수 있다.

상태변수와 코스테이트 미분 방정식을 풀기 위해서는 경계조건이 필요하다. 여기서는 초기 시간과 초기 상태변수, 그리고 최종 시간이 정해졌으므로
을 얻을 수 있다. 정정조건 (stationary condition)은 다음과 같다.
식 (7)에 의하면 최적제어 입력은 다음과 같이 계산할 수 있다.
식 (8)을 (4)에 대입하면 식 (5)와 함께 다음과 같이 2개의 결합 미분 방정식을 얻을 수 있다.
식 (9)를 해밀토니안 시스템이라고 한다. 식 (9)에 의하면 해밀토니안 시스템은 초기값

이제, 자유최종상태 LQR 문제를 풀어보자.
식 (6)은 최종 시간
만약 식 (10)을 만족하는
식 (4)와 (8)을 식 (11)에 대입하고 정리하면 다음과 같다.
위 식은 모든
식 (13)은 시간적으로 역방향(backward)으로 풀 수 있는 식이다. 식 (6)을 통해서 식 (10)을 유추해 냈으므로 시간
여기서 LQ 게인
최적제어는 다음과 같이 상태변수 피드백 제어의 형태가 된다.
LQ 게인은 상태변수에 비례하는 제어입력을 산출하는 비례 제어의 이득값이다. 행렬
최적제어를 시스템에 적용하면 다음과 같이 폐회로(closed-loop) 시스템을 얻을 수 있다.
식 (15)에 의하면 LQ 게인은 상태변수의 궤적과 무관하게 계산할 수 있다. 따라서 최적제어인 식 (16)을 시스템에 직접 적용하기 전에 미리 LQ 게인을 계산해서 저장해 놓을 수 있다. 그런 후 순차적으로 LQ 게인을 꺼내서 식 (17)로 최적 궤적을 계산할 수 있다.
리카티 방정식 (13)은 LQ 게인
또한 식 (17)의 폐회로 시스템 행렬로 표현할 수도 있다.
정리하면 다음과 같다.
'유도항법제어 > 최적제어' 카테고리의 다른 글
[Continuous-Time] 경로 제약조건이 있는 최적제어 문제 (0) | 2024.05.07 |
---|---|
[Continuous-Time] 무한구간 (Infinite-horizon) LQR (0) | 2023.12.21 |
[PSOC-12] 예제 : 램버트 문제 (Lambert’s problem) (0) | 2023.09.23 |
[PSOC-11] 가우스 유사 스펙트럴 (GPM) 기반 최적제어 (0) | 2023.07.20 |
[PSOC-10] 라다우 유사 스펙트럴 (RPM) 기반 최적제어 (0) | 2023.07.18 |
댓글