[KKT 조건 - 1] 등식과 부등식 제약조건이 있는 최적화 문제

제약조건이 없는 일반적인 최적화 문제는 다음과 같다.

$p^{⋆} = min_{x} f (x)$

여기서 $x$ 는 최적화 변수이고, $f (x)$ 는 목적함수(objective function)이다. $x^{⋆}$ 가 로컬(local) 최소점이 되기 위한 필요조건(necessary condition)은 $x = x^{⋆}$ 에서 $f$ 의 그래디언트(gradient)가 $0$ 이 되는 것이다.

$\nabla_{x} f (x^{⋆}) = 0$

등식 제약조건이 있는 일반적인 최적화 문제는 다음과 같다.

$\begin{aligned} p^{⋆} = min_{x} f (x) \\ subject to & h_{j} (x) = 0, j = 1, . . ., k \end{aligned}$

여기서 $h_{j} (x)$ 는 등식 제약함수(equality constraint function)이다. 제약함수는 편의상 다음과 같이 벡터 형태로 표현하기도 한다.

$h (x) = [\begin{matrix} h_{1} (x) \\ ⋮ \\ h_{k} (x) \end{matrix}] = 0$

여기서 부등식과 등식은 벡터 함수 $h (x)$ 의 성분별로 적용된다.

라그랑지 곱수법을 이용하면 등식 제약조건이 있는 최적화 문제를 다음과같이 제약조건이 없는 최적화 문제로 바꿀 수 있다.

$\begin{aligned} p^{⋆} & = min_{x, λ_{1}, . . ., λ_{k}} L (x, λ_{1}, λ_{2}, . . ., λ_{k}) \\ = min_{x, λ} L (x, λ) \end{aligned}$

여기서 $λ = {[\begin{matrix} λ_{1} & . . . & λ_{k} \end{matrix}]}^{T}$ 를 라그랑지 곱수(Lagrange multiplier)라고 한다. $L$ 은 라그랑지안(Lagrangian)이라고 하며 다음과 같이 정의한다.

$\begin{aligned} L (x, λ) & = f (x) + \sum_{j = 1}^{k} λ_{j} h_{j} (x) \\ = f (x) + λ^{T} h (x) \end{aligned}$

함수 $f (x)$ 가 $x^{⋆}$ 에서 로컬 최소값이 되기 위한 필요조건은 $x = x^{⋆}$ 와 $λ = λ^{⋆}$ 에서 $L$ 의 그래디언트(gradient)가 $0$ 이 되는 것이다.

$\begin{aligned} \nabla_{x} L (x^{⋆}, λ^{⋆}) = 0 \\ \nabla_{λ} L (x^{⋆}, λ^{⋆}) = 0 (or h_{j} (x^{⋆}) = 0, j = 1, . . ., k) \end{aligned}$

등식과 부등식 제약조건이 있는 일반적인 최적화 문제는 다음과 같다.

$\begin{aligned} p^{⋆} = min_{x} f (x) \\ subject to & g_{i} (x) \leq 0, i = 1, . . ., m \\ h_{j} (x) = 0, j = 1, . . ., k \end{aligned}$

여기서 $g_{i} (x)$ 를 부등식 제약함수(inequality constraint function), $h_{j} (x)$ 를 등식 제약함수라고 한다. 부등식, 등식 제약함수는 편의상 다음과 같이 벡터 형태로 표현하기도 한다.

$\begin{aligned} g (x) = [\begin{array}{c} g_{1} (x) \\ ⋮ \\ g_{m} (x) \end{array}] \leq 0 \\ h (x) = [\begin{array}{c} h_{1} (x) \\ ⋮ \\ h_{k} (x) \end{array}] = 0 \end{aligned}$

여기서 부등식과 등식은 벡터 함수 $g (x), h (x)$ 의 성분별로 적용된다.

만약 제약조건을 만족하는 $x$ 값이 존재하지 않는다면 최적화 문제는 실행 불가능(infeasible)이라고 하는데, 그 때의 최소값은 $p^{⋆} = \infty$ 가 된다.

부등식 제약조건이 있는 경우 등식 제약조건만 있을 때와 비슷한 방법으로 라그랑지 곱수를 도입하여 다음과 같이 라그랑지안 함수를 만들 수 있다.

$\begin{aligned} L (x, μ, λ) & = f (x) + \sum_{j = 1}^{m} μ_{j} g_{j} (x) + \sum_{j = 1}^{k} λ_{j} h_{j} (x) \\ = f (x) + μ^{T} g (x) + λ^{T} h (x) \end{aligned}$

등식 제약조건만 있을 때는 최적화 변수 $x$ 와 라그랑지 곱수에 대해서 라그랑지안의 그래디언트를 계산했지만 부등식 제약조건이 포함되면 이를 고려한 추가적인 수식이 더 필요한데, 이를 KKT(Karush-Kuhn-Tucker) 조건이라고 한다.

KKT 조건은 선형 및 비선형 최적화 문제에서 최적해를 구하기 위한 핵심적인 조건이다.

KKT 조건은

1. 선형 프로그래밍(LP, linear programming)문제에서는 최적화의 필요충분조건이다.

2. 컨벡스(볼록, convex) 최적화 문제에서는 최적화의 필요충분조건이다.

3. 비컨벡스(non-convex) 최적화 문제에서는 최적화의 필요조건이다.

여기서 비컨벡스 최적화 문제는 딥러닝 모델의 학습에서 일반적으로 나타나는 최적화 문제다.

'AI 수학 > 최적화' 카테고리의 다른 글

[KKT 조건 - 3] 프라이멀 문제와 듀얼 문제 (0)	2021.02.17
[KKT 조건 - 2] KKT 조건과 적용 예제 (0)	2021.01.18
최소화의 필요조건과 충분조건 (0)	2021.01.10
SGD에서 데이터를 무작위로 추출해야 하는 이유 (1)	2021.01.04
함수의 최소화 또는 최대화의 조건 (0)	2020.10.20

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

DeepCampus

[KKT 조건 - 1] 등식과 부등식 제약조건이 있는 최적화 문제

'AI 수학 > 최적화' 카테고리의 다른 글

댓글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

[KKT 조건 - 1] 등식과 부등식 제약조건이 있는 최적화 문제

'AI 수학 > 최적화' 카테고리의 다른 글

관련글

댓글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역