본문 바로가기

유도항법제어/최적제어31

[Continuous-Time] 고정최종상태 (Fixed-final-state) LQR 다음과 같이 선형 시스템이 있다. \[ \dot{\mathbf{x}}=A \mathbf{x}+B \mathbf{u} \tag{1} \] 이 시스템의 초기 시간 \(t_0\) 와 초기 상태변수 \(\mathbf{x}(t_0)\) 는 주어졌다고 가정한다. 또한 최종 시간 \(t_f\) 와 최종 상태변수 \(\mathbf{x}(t_f)\) 도 미리 원하는 값 \(\mathbf{x}_f\) 로 설정되었다고 가정한다. 따라서 \(dt_0=0\), \(d\mathbf{x}(t_0 )=0\), \(dt_f=0\), \(d\mathbf{x}(t_f )=0\) 이 되기 때문에 최적제어의 필요조건을 정리한 표에 의하면 경계조건은 자동으로 만족된다. 이 시스템의 비용함수도 다음과 같이 고정된 시간 구간 \([t_0, \ t.. 2023. 4. 13.
[Continuous-Time] 최종상태제약 (Final-state-constrained) LQR 다음과 같이 선형 시스템이 주어지고, \[ \dot{\mathbf{x}}=A\mathbf{x}+B \mathbf{u} \tag{1} \] 이 시스템의 목적함수도 다음과 같이 고정된 시간 구간 \([t_0, \ t_f]\) 에서 이차함수로 주어졌다고 하자. \[ J=\frac{1}{2} \mathbf{x}^T (t_f ) S_f \mathbf{x}(t_f )+ \frac{1}{2} \int_{t_0}^{t_f} \left( \mathbf{x}^T Q \mathbf{x}+ \mathbf{u}^T R \mathbf{u} \right) dt \tag{2} \] 최종 상태변수의 제약조건은 다음과 같이 설정되었다고 가정하자. \[ \psi (\mathbf{x}(t_f ), t_f )=C \mathbf{x}(t_f .. 2023. 4. 8.
[Continuous-Time] 최적제어 예제 간단한 최적제어 문제를 풀어보고자 한다. 최적제어 문제는 최종시간이 설정된(fixed) 값으로 주어지는지 아닌지, 그리고 최종 상태변수가 설정된 값으로 주어지는지 아닌지에 따라 다양하게 분류할 수 있다. 대개의 경우 초기시간과 상태변수 초기값은 설정된 값으로 주어진다. 먼저 최종시간과 최종 상태변수가 모두 주어진 경우다. 연속시간 비선형 시스템의 최적제어의 필요조건을 정리한 다음 표에 의하면, 이 경우 경계조건은 자동으로 만족된다. 일정한 속력 \(V\) 로 움직이는 비행체가 있다. 제어 목적은 비행체가 출발지에서 출발하여 비행 시간 \(t_f\) 가 경과한 후 목적지에 최소의 에너지를 사용하여 도착시키는 것이다. 그림에 비행체와 목적지, 출발지간의 기하하적인 관계가 나와 있다. 비행체의 운동 방정식은 .. 2022. 12. 14.
[Continuous-Time] 최적제어 문제 최적제어(optimal control)문제는 여러 가지 물리적인 제약조건을 만족하면서 어떤 성능지표(performance index) 또는 목적함수(objective function)를 최적화하도록 동적 시스템(dynamic system)의 제어변수(control variable)을 결정하는 문제이다. 제약조건(constraints)은 동적 시스템의 동역학과 함께 시스템 제어변수 및 상태변수의 경로 제약조건(path constraints), 상태변수의 초기값(initial value) 및 최종값(final value)에 관한 제약조건(constraint on the initial and final states)을 모두 포함한다. 목적함수는 설계자가 의도한대로 시스템을 움직이면서 의도한 성능을 발휘할 수 .. 2022. 12. 13.
[MPC] MPC를 위한 두가지 QP 모델 - 2 MPC(model predictive control) 문제를 최적화 문제인 QP(quadratic program)문제로 변환할 때 널리 사용되는 일반적인 방법( https://pasus.tistory.com/229 )은 모델이 조밀해져서 문제의 구조가 손실되는 단점이 있다. 고속 MPC(fast MPC)에서는 QP 문제로 변환할 시 적절한 변수 재정렬을 사용하여 희소(sparse)구조를 최대로 이용할 수 있도록 특별한 방법으로 변환하며, 최적화 기법을 적용할 시 warm start, fixed iteration, early termination등의 휴리스틱 기법을 이용하여 MPC 계산량을 대폭 줄이는 방법을 사용한다. fast MPC알고리즘은 스탠퍼드의 Boyd 교수와 그 제자의 논문인 'Fast Mod.. 2022. 12. 3.
[MPC] MPC를 위한 두가지 QP 모델 - 1 MPC는 다음과 같은 제약조건을 갖는 선형 시스템에서 \[ \begin{align} & \mathbf{x}_{t+1}=A \mathbf{x}_t+B \mathbf{u}_t \tag{1} \\ \\ & \mathbf{y}_t=C \mathbf{x}_t \\ \\ & \ \ \ \ \ \mathbf{u}_{min} \le \mathbf{u}_{t+i} \le \mathbf{u}_{max}, \ \ \ i=0, ... , N-1 \tag{2} \\ \\ & \ \ \ \ \ \mathbf{y}_{min} \le \mathbf{y}_{t+i} \le \mathbf{y}_{max}, \ \ \ i=1, ... , N \end{align} \] 매 시간 스텝마다 다음 목적함수가 일정 성능 예측구간 \([t, \ t.. 2022. 11. 30.
[MPC] 모델예측제어 개요 동적 최적화(dynamic optimization) 문제는 최적제어(optimal control) 문제라고도 하는데 매우 광범위한 영역에서 사용되고 있다. 예를 들면 인공위성을 궤도에 올리는 위한 가장 효율적인 연료 사용 전략이나 화학 공정 시설을 가동하는 가장 경제적인 방법을 찾는 문제 등을 들 수 있다. 이러한 동적 최적화 문제의 기본 가정은 동적 모델(dynamic model)이 주어진다는데 있다. 동적 모델의 예로서 다음과 같이 이산시간(discrete-time) 차분 방정식(difference equation)으로 표현된 비선형 시스템을 들 수 있다. \[ \mathbf{x}_{t+1}=\mathbf{f}(\mathbf{x}_t, \mathbf{u}_t) \tag{1} \] 여기서 \(\math.. 2022. 11. 28.
[PSOC-7] 유사 스펙트럴 방법 예제 유사 스펙트럴(pseudospectral) 방법은 다음과 같이 경계조건을 갖는 미분방정식이 있을 때, \[ \begin{align} & \mathcal{D} \mathbf{x}(t)=\mathbf{g}(t), \ \ \ \mathbf{x} \in V \subset \mathbb{R}^n \tag{1} \\ \\ & \mathcal{B} \mathbf{x}(t)=0, \ \ \ \mathbf{x} \in \partial V \end{align} \] 방정식의 미지해 \(\mathbf{x}(t)\) 를 다음과 같은 형식을 갖는 \(\mathbf{X}(t)\) 로 근사적으로 구하는 방법이다. \[ \mathbf{x}(t) \approx \mathbf{X}(t)= \sum_{i=1}^N \mathbf{d}_i .. 2022. 4. 24.
[PSOC-6] 유사 스펙트럴 방법 (Pseudospectral Method) 다음과 같이 경계조건을 갖는 미분방정식이 있다고 하자. \[ \begin{align} & \mathcal{D} \mathbf{x}(t)= \mathbf{g}(t), \ \ \ \mathbf{x} \in V \subset \mathbb{R}^n \tag{1} \\ \\ & \mathcal{B} \mathbf{x}(t)=0, \ \ \ \mathbf{x} \in \partial V \end{align} \] 여기서 \(\mathcal{D}\) 는 미분, \(\mathcal{B}\) 는 경계조건을 뜻하는 연산자이다. 위 미분방정식의 미지해 \(\mathbf{x}(t)\) 를 근사적으로 구한 해(approximate solution) \(\mathbf{X}(t)\) 를 다음과 같은 형식으로 구하고자 한다. \[.. 2022. 4. 23.
[PSOC-5] 가우시안 쿼드래처 (Gaussian Quadrature) 가우시안 쿼드래처(Gaussian quadrature)는 구간 \([-1, 1]\) 에서 어떤 함수 \(f(\tau)\) 의 적분값을 적분 구간내의 특정 지점에서의 함수값의 가중치 합으로 계산하는 수치적분 방법이다. \[ \int_{-1}^1 f(\tau) \ d \tau \approx \sum_{i=1}^N w_i f(\tau_i) \tag{1} \] 여기서 적분 구간내의 특정 지점인 \(\tau =\tau_1, \tau_2, ..., \tau_N\) 을 쿼드래처 포인트라고 하고, \(w_i\) 를 쿼드래처 포인트의 가중치(weighting)이라고 한다. 가우시안 쿼드래처의 정확도는 쿼드래처 포인트의 갯수와 점 사이의 간격에 달려있다. 함수 \(f(\tau)\) 를 \((N-1)\) 차 라그랑지 보간 .. 2021. 12. 18.