변분법 (calculus of variation)

최적화는 크게 정적 최적화(static optimization)와 동적 최적화(dynamic optimization)로 분류할 수 있다. 정적 최적화는 파라미터 최적화(parameter optimization)라고도 하며, 동적 최적화는 최적제어(optimal control) 문제라고 한다.

파라미터 최적화는 정적(static) 파라미터를 변수로 하는 어떤 함수(function)에서 최소값 또는 최대값을 산출하는 파라미터를 구하는 문제다. 반면에 동적 최적화는 '함수를 변수로 하는 함수' (함수의 함수로서 functional이라고 한다)에서 최소값 또는 최대값을 산출하는 함수를 구하는 문제다. 파라미터 최적화에 미분법이 필요하듯이 동적 최적화에는 변분법(calculus of variation)이 필요하다.

미분법이 어떤 함수 값을 최소화하거나 최대화하는 파라미터를 계산하는 방법을 다룬다면, 변분법은 functional의 값을 최소화하거나 최대화하는 함수를 계산하는 방법을 다룬다.

파라미터를 $n$ -차원 벡터 $q = {[\begin{matrix} q_{1} & q_{2} & \dots & q_{n} \end{matrix}]}^{T}$ 라고 할 때, 스칼라 함수 f( $q)$ 는 벡터 $q$ 로부터 어떤 실수 값을 연결하는 일대일 대응 관계를 나타낸다. 반면에 $x$ 의 함수인 $n$ -차원 벡터를 $y (x) = {[\begin{matrix} y_{1} (x) & y_{2} (x) & \dots & y_{n} (x) \end{matrix}]}^{T}$ 라고 할 때, functional $F (y)$ 는 함수 $y (x)$ 로부터 어떤 실수 값을 연결하는 일대일 대응 관계를 나타낸다.

예를 들면 다음은 2-차원 벡터 $q = {[\begin{matrix} q_{1} & q_{2} \end{matrix}]}^{T}$ 를 변수로 하는 함수다.

$\begin{matrix} (1) & f (q) = q_{1}^{2} + q_{2}^{2} - 4 \end{matrix}$

다음은 구간 $x_{0}$ 에서 $x_{f}$ 까지 정의된 함수 $y (x)$ 를 변수로 하는 functional이다.

$\begin{matrix} (2) & F (y) = \int_{x_{0}}^{x_{f}} y^{2} (x) d x \end{matrix}$

파라미터 $q$ 의 독립적 변화에 의해 유도된 함수 $f (q)$ 의 변화량을 계산해 보자. 파라미터 $q$ 의 변화량을 $Δ q$ 라고 하면, 함수의 증분(increment) $Δ f$ 는 다음 식으로 주어진다.

$Δ f = f (q + Δ q) - f (q)$

변화량이 매우 작을 때, 즉 극소(infinitesimal) 크기일 때에는 $d q$ 로 표기하고 함수의 증분도 미분(differential) $d f$ 로 표기한다.

$d f = f (q + d q) - f (q)$

예를 들어서 식 (1)의 미분은 다음과 같다.

$\begin{aligned} d f & = (q_{1} + d q_{1})^{2} + (q_{2} + d q_{2})^{2} - 4 - [q_{1}^{2} + q_{2}^{2} - 4] \\ = 2 q_{1} d q_{1} + (d q_{1})^{2} + 2 q_{2} d q_{2} + (d q_{2})^{2} \\ = 2 q_{1} d q_{1} + 2 q_{2} d q_{2} \end{aligned}$

여기서 $(d q_{1})^{2}$ 과 $(d q_{2})^{2}$ 은 극소량의 제곱이기 때문에 각각 $(d q_{1})^{2} \to 0$ , $(d q_{2})^{2} \to 0$ 이다. 그래서 미분 $d f$ 를 1차(first-order) 증분 또는 선형 증분이라고 한다. 다음 그림은 증분과 1차 선형 증분의 차이를 보여준다.

한편, 미분 $d f$ 와 미분 $d q_{i}$ 의 비율 $\frac{d f}{d q_{i}}$ 를 도함수(derivative)라고 한다. 도함수(여기서는 partial derivative)를 이용하면 미분 $d f$ 는 다음과 같이 간단히 계산할 수 있다.

$\begin{aligned} d f & = \frac{\partial f}{\partial q_{1}} d q_{1} + \frac{\partial f}{\partial q_{2}} d q_{2} \\ = 2 q_{1} d q_{1} + 2 q_{2} d q_{2} \end{aligned}$

Functional $F (y)$ 에서도 함수 $y (x)$ 의 독립적 변화에 의해 유도된 변화량을 계산할 필요가 있다. $F (y)$ 의 증분은 함수 $y (x)$ 의 미분 $d y$ 와 변수의 미분 $d x$ 에 따라 달라지는데 이 둘은 서로 독립이 아니다. 그러므로 $d x$ 와는 독립적인 $y (x)$ 의 변화량을 정의할 필요가 있다.

$x$ 를 고정시킨 상테에서 함수 $y (x)$ 를 극소 크기만큼 변화시킨 양을 변분(variation)이라고 하고 $δ y (x)$ 로 표기한다. 그러면 functional의 변분 $δ F$ 는 다음 식으로 주어진다.

$δ F = F (y + δ y) - F (y)$

예를 들어서 식 (2)에서 적분 구간 $x_{0}$ 와 $x_{f}$ 가 고정되어 있을 때, $F (y)$ 의 변분은 다음과 같다.

$\begin{aligned} δ F (y) & = \int_{x_{0}}^{x_{f}} {(y (x) + δ y (x))}^{2} d x - \int_{x_{0}}^{x_{f}} y^{2} (x) d x \\ = \int_{x_{0}}^{x_{f}} [y^{2} (x) + 2 y (x) δ y (x) + (δ y (x))^{2} - y^{2} (x)] d x \\ = \int_{x_{0}}^{x_{f}} 2 y (x) δ y (x) d x \end{aligned}$

여기서 $(δ y (x))^{2}$ 은 극소량의 제곱이기 때문에 $\int_{x_{0}}^{x_{f}} (δ y (x))^{2} d x \to 0$ 이다. 그래서 변분 $δ F$ 를 1차 증분이라고 한다.

여기서 중요한 것은 함수 $y (x)$ 에서 미분 $d y$ 와 변분 $δ y$ 는 다르다는 것이다. 미분 $d y$ 는 미분 $d x$ 에 종속된다. 반면 변분 $δ y$ 는 $d x$ 와는 독립이다. $x$ 를 고정시키고 극소 크기만큼 변화시켰기 때문이다.

도함수를 이용하면 변분 $δ F$ 를 다음과 같이 간단히 계산할 수 있다.

$\begin{aligned} δ F (y) & = \int_{x_{0}}^{x_{f}} \frac{\partial y^{2} (x)}{\partial y} δ y (x) d x \\ = \int_{x_{0}}^{x_{f}} 2 y (x) δ y (x) d x \end{aligned}$

함수를 극소 크기만큼 변화시켰다는 의미는 무엇일까. 함수의 크기는 어떻게 정할 수 있을까.

정적 파라미터의 크기를 놈(norm)으로 정하듯이, 함수의 '크기'도 함수의 놈(norm)으로 정할 수 있다. 이에 대해서는 다음에 ...

만약 함수에 부과된 제약조건이 없을 경우에는 함수 $f (q)$ 가 (로컬) 최소값 또는 최대값을 갖기 위한 필요조건은 다음과 같다.

$d f (q^{⋆}) = 0$

위 조건을 만족하는 파라미터 $q^{⋆}$ 를 정류점(stationary point)이라고 한다. 정류점에서는 함수의 미분이 $0$ 이 된다. 어떤 함수가 어떤 파라미터 값에서 (로컬) 최소값 또는 최대값을 갖는다면 그 값이 바로 정류점이고 그 때 함수의 미분은 $0$ 이다. 이것이 미분법의 정리다.

마찬가지로 functional $F (y)$ 가 (로컬) 최소값 또는 최대값을 갖기 위한 필요조건은 다음과 같다.

$δ F (y^{⋆}) = 0$

위 조건을 만족하는 함수 $y^{⋆}$ 를 정류함수라고 한다. 정류 함수에서는 functional의 변분이 $0$ 이 된다. 어떤 functional이 어떤 함수에서 (로컬) 최소값 또는 최대값을 갖는다면 그 함수가 바로 정류 함수이고 그 때 functional의 변분은 $0$ 이다. 이것이 변분법의 정리다.

변분법은 함수의 최소값 또는 최대값에서 미분이 $0$ 이라는 미분법의 정리를 functional로 확장한 것이다.

'유도항법제어 > 최적제어' 카테고리의 다른 글

오일러-라그랑지 방정식과 브라키스토크론 문제의 풀이 (0)	2021.01.13
변분법과 오일러-라그랑지 방정식 (0)	2021.01.12
브라키스토크론 문제와 변분법 (0)	2021.01.08
[Discrete-Time] 자유최종상태 (Free-final-state) LQR (1)	2020.10.31
[Discrete-Time] LQR 문제 (0)	2020.10.31

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

DeepCampus

변분법 (calculus of variation)

'유도항법제어 > 최적제어' 카테고리의 다른 글

댓글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

변분법 (calculus of variation)

'유도항법제어 > 최적제어' 카테고리의 다른 글

관련글

댓글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역