본문 바로가기

유도항법제어99

변분법과 오일러-라그랑지 방정식 오일러-라그랑지 방정식(Euler-Lagrange equation)은 어떤 함수와 그 도함수(derivative)의 함수인 functional의 값을 최대화 또는 최소화하는 함수를 유도하기 위한 미분 방정식이다. 수식으로 살펴보자. 다음과 같은 functional \(F(y, y^\prime)\)가 있다고 하자. \[ F(y, y^\prime)= \int_{x_0}^{x_f} h(y(x), y^\prime (x)) \ dx \] 여기서 \(y(x)\)는 \(x\)의 함수이고, \(y^\prime (x)= \frac{dy}{dx}\)는 \(y(x)\)의 도함수이며, 적분 구간의 양쪽 경계 \(y(x_0)\)와 \(y(x_f)\)는 고정된 값으로 가정한다. Functional \(F(y, y\prime)\).. 2021. 1. 12.
변분법 (calculus of variation) 최적화는 크게 정적 최적화(static optimization)와 동적 최적화(dynamic optimization)로 분류할 수 있다. 정적 최적화는 파라미터 최적화(parameter optimization)라고도 하며, 동적 최적화는 최적제어(optimal control) 문제라고 한다. 파라미터 최적화는 정적(static) 파라미터를 변수로 하는 어떤 함수(function)에서 최소값 또는 최대값을 산출하는 파라미터를 구하는 문제다. 반면에 동적 최적화는 '함수를 변수로 하는 함수' (함수의 함수로서 functional이라고 한다)에서 최소값 또는 최대값을 산출하는 함수를 구하는 문제다. 파라미터 최적화에 미분법이 필요하듯이 동적 최적화에는 변분법(calculus of variation)이 필요하다.. 2021. 1. 11.
[Continuous-Time] 선형 시스템 시스템은 여러가지 기준으로 다양하게 분류될 수 있는데, 우선 시스템을 선형 시스템과 비선형 시스템으로 분류할 수 있다. 선형 시스템(linear system)인지 판별하기 위해서 두 개의 초기값과 입력 및 출력 세트가 있다고 하자. 첫 번째 세트는 임의의 시간 \(t=t_0\)에서 상태변수의 초기값이 \(\mathbf{x}_1 (t_0)\)이고, 시간 영역 \(t \ge t_0\)에서 입력이 \(\mathbf{u}_1 (t)\)일 때 출력이 \(\mathbf{y}_1 (t)\)이고, 두 번째 세트는 상태변수의 초기값이 \(\mathbf{x}_2 (t_0)\)이고 시간 영역 \(t \ge t_0\)에서 입력이 \(\mathbf{u}_2 (t)\)일 때 출력이 \(\mathbf{y}_2 (t)\)이다. 선형.. 2021. 1. 10.
시스템의 수학적 표현 방법 시스템은 어떤 입력에 대해서 반응하여 동작하는 장치나 구성품의 집합을 뜻한다. 시스템의 반응을 출력 또는 응답이라고 한다. 시스템은 꼭 물리적인 장치나 구성품 또는 하드웨어일 필요는 없고, 알고리즘 또는 소프트웨어일 수도 있다. 아니면 사회경제 제도일 수도 있다. 세상에는 무인기 시스템, 제어 시스템, 금융 시스템 등등 많은 시스템이 있다. 제어 대상 시스템을 수학적으로 표현하는 방법에는 두 가지가 있다. 입력과 출력의 관계식으로 표현하는 방법과 상태공간(state-space) 방정식으로 표현하는 방법이다. 입력과 출력의 관계식으로 표현하는 방법을 시스템의 외부적 표현 방법이라고도 하는데 다음과 같이 연산자(operator)를 이용하여 입출력 관계식을 함수로 나타낸다. \[ \mathbf{y}(t)= \.. 2021. 1. 9.
안티 와인드업 (Anti-Windup) 제어 대상 시스템에 대해서 우리가 바라는 동작이 무엇인지 수치로 정해준 것을 명령(command)이라고 하고, 이 값과 실제 시스템의 출력의 차이를 추종 오차(tracking error)라고 한다. 비례-적분(PI, proportional-integral) 제어기는 출력이 정정상태(steady-state)에 돌입했을 때의 추종 오차를 줄이기 위한 제어 기법이다. 아래 그림은 일반적인 제어 시스템의 구조를 보여준다. \(r\)을 명령, \(y\)를 출력, \(e=r-y\)를 추종 오차, \(u\)를 제어 신호라고 한다. PI 제어기는 추종 오차의 크기에 비례하는 값과 오차의 적분 (또는 오차의 누적)에 비례하는 값을 제어 신호로 내보낸다. \[ u(t)=K_p e(t)+K_I \int_0^t e(t) \ .. 2021. 1. 9.
브라키스토크론 문제와 변분법 같은 평면에 높이가 다른 두 지점 \(A\)와 \(B\)가 있다. 지점 \(A\)는 지점 \(B\)보다 높은 곳에 위치해 있다. 이 때 상단 지점 \(A\)에 정지해 있던 물체가 마찰없이 중력의 영향으로만 미끄러져서 가장 짧은 시간에 하단 지점 \(B\)까지 도착할 수 있는 경로는 무엇일까? 지점 \(A\)와 \(B\)를 잇는 경로는 무수히 많다. 언뜻 생각하면 두 지점을 직선으로 연결한 경로(위 그림에서 녹색 경로)가 두 지점 \(A\)와 \(B\)를 연결하는 최단 경로이기 때문에 최단 시간에 이동할 수 있는 경로도 되지 않을까 싶지만, 그렇지 않다. 중력 때문에 생기는 물체의 속도도 고려해야 한다. >수평 방향을 \(x\)축, 수직 방향을 \(y\)축으로 한다면, 경로는 \(x\)를 변수로 하는 함수.. 2021. 1. 8.
[Discrete-Time] 자유최종상태 (Free-final-state) LQR 다음과 같은 선형 시스템에 대해서 \[ \mathbf{x}_{t+1}=F_t \mathbf{x}_t+G_t \mathbf{u}_t \tag{1} \] 목적함수가 다음과 같이 2차함수로 주어지는 \[ J_t = \frac{1}{2} \mathbf{x}_N^T S_N \mathbf{x}_N + \frac{1}{2} \sum_{t=i}^{N-1} \left( \mathbf{x}_t^T Q_t \mathbf{x}_t + \mathbf{u}_t^T R_t \mathbf{u}_t \right) \tag{2} \] LQR 문제의 해는 다음과 같다. 여기서는 최종 상태변수에 관한 제약조건이 없다고 가정한다 (https://pasus.tistory.com/38). \[ \begin{align} & \mathbf{x}_{.. 2020. 10. 31.
[Discrete-Time] LQR 문제 비선형 시스템에 대해서 매우 일반적인 목적함수를 적용한 최적제어 문제에 대한 해를 유도해 보았다 (https://pasus.tistory.com/35). 그러나 이러한 셋팅으로는 명시적인 제어법칙(control law)을 유도해 내기가 어렵다. LQR은 선형 시스템에 대해서 2차 함수로 주어진 목적함수를 이용한 최적제어 문제에서 도출되었으며 명시적인 제어법칙을 가지고 있는 제어기이다. LQR은 linear quadratic regulator의 약자로서 시스템이 선형(linear)이며 목적함수가 2차함수(quadratic)라는 의미이다. regulator는 시스템의 상태를 \(0\) (또는 set point로 불리는 상수 상태변수 값)으로 만드는 제어기를 뜻한다. LQR은 PID 제어기와 함께 실제 응용 .. 2020. 10. 31.
[Discrete-Time] 최적제어 문제 다음과 같이 이산시간(discrete-time) 차분 방정식(difference equation)으로 표현된 비선형 시스템이 있다. \[ \mathbf{x}_{t+1} = \mathbf{f}_t (\mathbf{x}_t, \mathbf{u}_t) \tag{1} \] 여기서 아래 첨자 \( t \)는 시간스텝을 나타낸다. 일반적으로 시스템을 시변(time-varying)으로 간주하기 때문에 함수 \( \mathbf{f}_t \)에 아래 첨자로 시간 표시를 한다. 시불변 시스템일 경우에는 생략하면 된다. 상태변수는 \( \mathbf{x}_t \in \mathbb{R}^n \), 제어변수는 \( \mathbf{u}_t \in \mathbb{R}^p \)이다. 최적제어 문제는 시스템이 어떤 스칼라 목적함수를 .. 2020. 10. 27.