다음과 같은 선형 시스템과
시간 구간
목적함수를 최소화하는 최종자유상태 LQR (free-final-state linear quadratic regulator) 문제의 해는 다음과 같이 주어진다 (https://pasus.tistory.com/317).
식 (1)과 (2)에서 시스템 행렬
상수 행렬로 된 피드백 게인
상수 피드백 게인을 구하기 위한 한 방법으로서 목적함수의 시간 구간을 무한대로 확장시켜보자. 초기 시간은
여기서

식 (4)를 식 (1)에 대입하면 다음과 같이 피드백 시스템을 얻을 수 있다.
또한 식 (4)를 (5)에 대입하면 목적함수는 다음과 같이 된다.
이제 다음 식을 만족하는 상수 반정정 행렬(semi-positive definite matrix)
그러면 식 (7)은 다음과 같이 된다.
만약 피드백 시스템이 점근적으로 안정(asymptotically stable)하다면
한편 식 (8)을 전개하면,
이 되는데 위 식은 모든
위 식에서
요약하면, 어떤 상수 피드백 게인 행렬
이제 이 결과를 사용하여 목적함수
먼저 식 (10)에서
이제 문제는 시스템의 운동모델 (1)을 만족하면서 식 (5)를 최소화하기 위한 피드백 게인
라그랑지 곱수(Lagrange multiplier) 방법을 이용하여 제약조건이 있는 최적화 문제를 제약조건이 없는 최적화 문제로 수정한다.
여기서
식 (15)의 세번째 식으로
식 (16)을 식 (12)에 대입하면 다음과 같이 된다.
이제 최종자유상태 LQR (free-final-state linear quadratic regulator) 문제의 해 (3)에서 리카티 방정식과 식 (17)을 비교해보면, 식 (17)은 리카티 방정식의 정정상태(steady-state) 해
이제 문제는 식 (17)을 만족하는 반정정 행렬(semi-positive definite matrix)
정리:
또 다른 문제는 피드백 게인 (16)을 사용한 피드백 시스템 (6)이 점근적으로 안정 (asymptotically stable)한지 여부다. 이에 대해서도 증명없이 다음 정리를 인용한다.
정리:
대수 리카티 방정식의 유일한 정정행렬(positive-definite matrix) 해
그리고 피드백 시스템
최종자유상태 LQR 문제와 무한구간 LQR 문제 사이에는 중요한 차이점이 두가지가 있다.
먼저 최종자유상태 LQR은 안정화가능성(stabilizable) 가정을 필요로 하지 않는다는 점이다. 시스템의 안정화가능성 여부에 상관없이 목적함수를 최소화하는데 최선을 다한다. 하지만 무한구간 LQR 에서는 안정화가능성 가정이 필요하다. 목적함수의 적분 구간이 무한대이므로 적분값이 발산할 가능성이 있기 때문이다.
두번째는 무한구간 LQR은 '정리'에서 제시한 조건만 충족한다면 안정성이 보장된다는 것이다. 물론
무한구간 LQR의 장점은 피드백 게인 행렬이 상수이기 때문에 구현이 매우 간단하고 피드백 시스템의 안정성이 보장된다는데 있다. 일반적으로 LQR 이라 하면 보통 무한구간 LQR을 일컫는다.
무한구간 LQR 문제를 정리하면 다음과 같다.
'유도항법제어 > 최적제어' 카테고리의 다른 글
[Continuous-Time] 경로 제약조건이 있는 최적제어 문제 (0) | 2024.05.07 |
---|---|
[Continuous-Time] 자유최종상태 (Free-final-state) LQR (0) | 2023.12.19 |
[PSOC-12] 예제 : 램버트 문제 (Lambert’s problem) (0) | 2023.09.23 |
[PSOC-11] 가우스 유사 스펙트럴 (GPM) 기반 최적제어 (0) | 2023.07.20 |
[PSOC-10] 라다우 유사 스펙트럴 (RPM) 기반 최적제어 (0) | 2023.07.18 |
댓글