프라이멀 문제와 듀얼 문제의 유도

제약조건을 갖는 최적화 문제는 지시함수(indicator function)를 이용하면 제약조건이 없는 최적화 문제로 바꿀 수 있다.

지시함수는 어떤 집합에 어떤 값이 속하는지를 표시하는 함수로서 어떤 집합 $X$ 의 지시함수 $I_{X}$ 는 다음과 같이 정의된다.

$\begin{matrix} (1) & I_{X} (x) = {\begin{cases} 0, & if x \in X \\ \infty, & if x \notin X \end{cases} \end{matrix}$

다음과 같은 제약조건을 갖는 최적화 문제가 있을 때,

$\begin{aligned} (2) & min_{x \in R^{n}} f (x) \\ subject to: & x \in X \end{aligned}$

지시함수를 이용하면 위 최적화 문제를 다음과 같이 제약조건이 없는 형태로 변환할 수 있다.

$\begin{matrix} (3) & min_{x \in R^{n}} f (x) + I_{X} (x) \end{matrix}$

구체적으로 등식 제약조건과 부등식 제약조건이 있는 최적화 문제에 대해서 지시함수를 이용하여 제약조건이 없는 최적화 문제로 변환해 보자. 먼저 등식 제약조건이 있는 경우다.

$\begin{aligned} (4) & min_{x} f (x) \\ subject to: & h_{j} (x) = 0, j = 1, . . ., k \end{aligned}$

등식 제약함수의 지시함수는 다음과 같이 함수의 max 연산으로 표현 가능하다.

$\begin{aligned} (5) & I_{j} (h_{j} (x)) & = {\begin{cases} 0, & if h_{j} (x) = 0 \\ \infty, & if h_{j} (x) \neq 0 \end{cases} \\ = max_{λ_{j}} λ_{j} h_{j} (x) \end{aligned}$

여기서 $λ_{j}$ 는 일종의 패널티 함수(penalty function)에서의 패널티 항이라고 볼 수 있다. 식 (5)를 (3)에 대입하면 등식 제약조건이 있는 최적화 문제 (4)를 다음과 같이 minmax 문제로 바꿀 수 있다.

$\begin{matrix} (6) & min_{x} max_{λ_{j}} f (x) + \sum_{j = 1}^{k} λ_{j} h_{j} (x) \end{matrix}$

식 (6)은 등식 제약조건이 있는 최적화 문제를 minmax 문제로 정식화한 것이다. 한편, 라그랑지 곱수법(Lagrange multiplier)을 이용하면 등식 제약조건이 있는 최적화 문제를 다음과 같이 정식화 할 수 있었다.

$\begin{matrix} (7) & min_{x, λ_{1}, λ_{2}, . . ., λ_{k}} f (x) + \sum_{j = 1}^{k} λ_{j} h_{j} (x) \end{matrix}$

식 (6)과 (7)은 동일한 최적화 문제에 대한 두가지 관점으로 해석할 수 있다. 식 (6)에 있는 $λ_{j}$ 도 식 (7)에서와 같이 라그랑지 곱수라고 한다.

부등식 제약조건이 있는 최적화 문제는 다음과 같다.

$\begin{aligned} (8) & min_{x} f (x) \\ subject to: & g_{i} (x) \leq 0, i = 1, . . ., m \end{aligned}$

마찬가지로 부등식 제약함수의 지시함수도 다음과 같이 함수의 max 연산으로 표현 가능하다.

$\begin{aligned} (9) & I_{i} (g_{i} (x)) & = {\begin{cases} 0, & if g_{i} (x) \leq 0 \\ \infty, & if g_{i} (x) > 0 \end{cases} \\ = max_{μ_{i} \geq 0} μ_{i} g_{i} (x) \end{aligned}$

위 식에서 식 (5)와 차이점은 라그랑지 곱수 $μ_{i}$ 가 음수(마이너스)가 아니라는 조건이 있다는 것이다. 이것은 식 (9)를 지시함수로 만들기 위해 필요한 조건이다. 식 (9)를 (3)에 대입하면 부등식 제약조건이 있는 최적화 문제 (8)을 다음과 같이 minmax 문제로 바꿀 수 있다.

$\begin{matrix} (10) & min_{x} max_{μ_{i} \geq 0} f (x) + \sum_{i = 1}^{m} μ_{i} g_{i} (x) \end{matrix}$

최종적으로 식 (6)과 (10)을 이용하면 등식과 부등식 제약조건이 있는 일반적인 최적화 문제를 다음과 같이 제약조건이 없는 minmax 문제로 바꿀 수 있다.

$\begin{matrix} (11) & min_{x} max_{λ_{j}, μ_{i} \geq 0} f (x) + \sum_{i = 1}^{m} μ_{i} g_{i} (x) + \sum_{j = 1}^{k} λ_{j} h_{j} (x) \end{matrix}$

식 (11)의 함수를 라그랑지안(Lagrangian)이라고 한다.

$\begin{matrix} (12) & L (x, μ_{1}, . . ., μ_{m}, λ_{1}, . . ., λ_{k}) = f (x) + \sum_{i = 1}^{m} μ_{i} g_{i} (x) + \sum_{j = 1}^{k} λ_{j} h_{j} (x) \end{matrix}$

식 (11)에서 min과 max의 순서를 바꾸면 다음과 같이 maxmin 문제가 된다.

$\begin{matrix} (13) & max_{λ_{j}, μ_{i} \geq 0} min_{x} f (x) + \sum_{i = 1}^{m} μ_{i} g_{i} (x) + \sum_{j = 1}^{k} λ_{j} h_{j} (x) \end{matrix}$

식 (13)을 듀얼 문제(dual problem)라고 하고, 식 (11)을 프라이멀 문제(primal problem)라고 한다. 이 둘은 최적화 문제에 대한 두가지 관점을 보여주는데 어떤 문제에서는 프라이멀 문제보다도 듀얼 문제로 바꾸어서 푸는 것이 효과적일 수 있다. 프라이멀 문제와 듀얼 문제에 대한 논의는 다음 게시글을 참고하기 바란다.

[KKT 조건 - 3] 프라이멀 문제와 듀얼 문제

최적화 문제는 두 가지 관점에서 문제를 표현할 수 있는데 프라이멀 문제(primal problem)와 듀얼 문제(dual problem)가 그것이다. 어떤 문제에서는 프라이멀 문제보다도 듀얼 문제로 바꾸어 푸는 것이

pasus.tistory.com

'AI 수학 > 최적화' 카테고리의 다른 글

뉴턴방법 (Newton’s Method) (0)	2022.04.08
내부점 방법 (Interior-Point Method)의 개념 (0)	2022.04.06
역전파 (Backpropagation) 계산 (0)	2021.03.31
벡터 함수를 행렬로 미분하기 (0)	2021.03.27
다변수 함수의 연쇄법칙 (Chain Rule) (1)	2021.03.23

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

DeepCampus

프라이멀 문제와 듀얼 문제의 유도

'AI 수학 > 최적화' 카테고리의 다른 글

댓글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

프라이멀 문제와 듀얼 문제의 유도

'AI 수학 > 최적화' 카테고리의 다른 글

관련글

댓글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역