다음과 같은 선형 시스템에 대해서
목적함수가 다음과 같이 2차함수로 주어지는
LQR 문제의 해는 다음과 같다. 여기서는 최종 상태변수에 관한 제약조건이 없다고 가정한다 (https://pasus.tistory.com/38).
최적제어는 식 (5)로부터 다음과 같이 주어진다.
시스템의 최종 상태변수가 정해지지 않고 계산되어야 한다면, 즉 자유최종상태(free-final-state) 문제라면
이제, 자유최종상태 LQR 문제를 풀어보자.
식 (8)은 시간스텝
만약 식 (9)를 만족하는
식 (10)을
이번에는 식 (9)를 식 (4)에 대입하면 다음식을 얻을 수 있다.
식 (11)을 (12)에 대입하고 정리하면 다음과 같이 된다.
위 식은 모든
행렬 역변환 정리(matrix inversion lemma)에 의하면 식 (14)는 다음 식이 된다.
식 (15)는 시간적으로 역방향(backward)으로 풀 수 있는 식이다. 식 (15)의 오른쪽 항은
최종값
시스템 운동인 식 (3)을 식 (16)에 대입하면,
가 되고, 이 식을 정리하면 최종적으로 다음 식을 얻을 수 있다.
여기서 LQ 게인
최적제어는 다음과 같이 상태변수 피드백 제어의 형태가 된다.
LQ 게인은 상태변수에 비례하는 제어입력을 산출하는 비례 제어의 이득값이다. 식 (19)에 의하면 LQ 게인은 상태변수의 궤적과 무관하게 계산할 수 있다. 따라서 최적제어인 식 (20)을 시스템에 직접 적용하기 전에 미리 LQ 게인을 계산해서 저장해 놓을 수 있다. 그런 후 순차적으로 LQ 게인을 꺼내서 식 (14)로 최적제어 값을 계산해서 시스템에 인가하면 최적 궤적 시퀀스

요약하면, LQR은 최종 시간에서부터 역방향 시간으로 LQ 게인을 계산하는 역방향 패스(backward pass)와 순방향 시간으로 최적제어를 시스템에 적용하여 궤적을 계산하는 순방향 패스(forward pass)로 구성된다.
'유도항법제어 > 최적제어' 카테고리의 다른 글
변분법과 오일러-라그랑지 방정식 (0) | 2021.01.12 |
---|---|
변분법 (calculus of variation) (0) | 2021.01.11 |
브라키스토크론 문제와 변분법 (0) | 2021.01.08 |
[Discrete-Time] LQR 문제 (0) | 2020.10.31 |
[Discrete-Time] 최적제어 문제 (1) | 2020.10.27 |
댓글