반복적인 기댓값 계산

랜덤변수(random variable) $X$ 와 $Y$ 의 함수인 $g (X, Y)$ 의 기댓값 $E [g (X, Y)]$ 는 다음과 같이 조건부 기댓값을 두 번 반복하여 계산해서 구할 수 있다.

$E [g (X, Y)] = E_{Y} [E_{X} [g (X, Y) | Y]]$

여기서 $E_{X} [\cdot]$ 는 기댓값을 확률밀도함수 $p_{X | Y} (x | y)$ 를 이용하여 계산한 것이고 $E_{Y} [\cdot]$ 는 기댓값을 $p_{Y} (y)$ 를 이용하여 계산한 것이다.

위 관계식을 증명해 보자.

$\begin{aligned} E_{Y} [E_{X} [g (X, Y) | Y]] & = \int_{- \infty}^{\infty} E_{X} [g (X, Y) | Y = y] p_{Y} (y) d y \\ = \int_{- \infty}^{\infty} (\int_{- \infty}^{\infty} g (x, y) p_{X | Y} (x | y) d x) p_{Y} (y) d y \\ = \int_{- \infty}^{\infty} \int_{- \infty}^{\infty} g (x, y) p_{X | Y} (x | y) p_{Y} (y) d x d y \\ = \int_{- \infty}^{\infty} \int_{- \infty}^{\infty} g (x, y) p_{X Y} (x, y) d x d y \\ = E [g (X, Y)] \end{aligned}$

위 결과는 기댓값을 계산할 때 매우 유용하게 쓰인다.

예를 들면 $E [X | Y] = Y^{2}$ 이고 $Y$ 의 확률밀도함수가 다음과 같이 주어졌을 때,

$p_{Y} (y) = {\begin{cases} 1, & 0 \leq y \leq 1 \\ 0, & o t h e r w i s e \end{cases}$

$X$ 의 기댓값 $E [X]$ 를 계산해 보자. $E [X]$ 를 계산하기 위해서는 확률밀도함수 $p_{X} (x)$ 가 필요한데 $p_{X | Y} (x | y)$ 가 주어지지 않았으므로 $p_{X} (x)$ 는 알 수 없다. 하지만 다음과 같이 반복적인 기댓값 계산 방법으로 $E [X]$ 를 계산할 수 있다.

$\begin{aligned} E [X] & = E_{Y} [E_{X} [X | Y]] \\ = \int_{- \infty}^{\infty} y^{2} p_{Y} (y) d y = \int_{0}^{1} y^{2} p_{Y} (y) d y \\ = \frac{1}{3} \end{aligned}$

이번에는 조건부 분산(conditional variance) 예를 들어 보자.

랜덤변수 $Y$ 가 $y$ 로 주어졌을 때 $X$ 의 조건부 분산 $V a r (X | Y = y)$ 는 확률밀도함수 $p_{X | Y} (x | y)$ 를 이용한 $X$ 의 분산으로 정의하며 다음과 같이 주어진다.

$\begin{aligned} V a r (X | Y = y) & = E [{(X - E [X | Y = y])}^{2} | Y = y] \\ = E [X^{2} - 2 X E [X | Y = y] + {(E [X | Y = y])}^{2} | Y = y] \\ = E [X^{2} | Y = y] - 2 E [X E [X | Y = y]] + E [{(E [X | Y = y])}^{2} | Y = y] \end{aligned}$

여기서 두번째 항은.

$\begin{aligned} E [X E [X | Y = y] | Y = y] & = \int_{- \infty}^{\infty} x E [X | Y = y] p_{X | Y} (x | y) d x \\ = \int_{- \infty}^{\infty} x (\int_{- \infty}^{\infty} x^{'} p_{X | Y} (x^{'} | y) d x^{'}) p_{X | Y} (x | y) d x \\ = (\int_{- \infty}^{\infty} x^{'} p_{X | Y} (x^{'} | y) d x^{'}) \int_{- \infty}^{\infty} x p_{X | Y} (x | y) d x \\ = {(E [X | Y = y])}^{2} \end{aligned}$

이므로 분산은 다음과 같이 된다.

$V a r (X | Y = y) = E [X^{2} | Y = y] - {(E [X | Y = y])}^{2}$

랜덤변수 $V a r (X | Y)$ 는 랜덤변수 $Y$ 의 함수로서 $Y$ 가 $y$ 값을 취하면 조건부 분산 $V a r (X | Y = y)$ 가 된다. 따라서 랜덤변수 $V a r (X | Y)$ 의 기댓값은 다음과 같이 계산된다.

$\begin{aligned} E_{Y} [V a r (X | Y)] & = E_{Y} [E [X^{2} | Y] - {(E [X | Y])}^{2}] \\ = E [X^{2}] - E_{Y} [{(E [X | Y])}^{2}] \end{aligned}$

위 식의 첫번째 항에 반복적인 기댓값 계산 방법을 적용하였다.

한편, 랜덤변수 $E [X | Y]$ 도 랜덤변수 $Y$ 의 함수로서 $Y$ 가 $y$ 값을 취하면 조건부 기댓값은 $E [X | Y = y]$ 가 된다. 따라서 랜덤변수 $E [X | Y]$ 의 분산은 다음과 같이 계산할 수 있다.

$\begin{aligned} V a r (E [X | Y]) & = E_{Y} [{(E [X | Y] - E_{Y} [E [X | Y]])}^{2}] \\ = E_{Y} [{(E [X | Y])}^{2} - 2 E [X | Y] E_{Y} [E [X | Y]] + {(E_{Y} [E [X | Y]])}^{2}] \\ = E_{Y} [{(E [X | Y])}^{2}] - {(E_{Y} [E [X | Y]])}^{2} \\ = E_{Y} [{(E [X | Y])}^{2}] - {(E [X])}^{2} \end{aligned}$

마찬가지로 위 식의 두번째 항에 반복적인 기댓값 계산 방법을 적용하였다.

랜덤변수 $V a r (X | Y)$ 의 기댓값과 랜덤변수 $E [X | Y]$ 의 분산을 더하면 다음과 같이 된다.

$\begin{aligned} E_{Y} [V a r (X | Y)] + V a r (E [X | Y]) & = E [X^{2}] - {(E [X])}^{2} \\ = V a r (X) \end{aligned}$

위 식을 조건부 분산의 법칙이라고 한다.

'AI 수학 > 랜덤프로세스' 카테고리의 다른 글

랜덤변수의 함수와 샘플링 - 2 (0)	2020.12.24
랜덤변수의 함수와 샘플링 - 1 (0)	2020.12.22
베이즈(Bayes) 정리 (0)	2020.11.13
샘플평균과 샘플분산 (0)	2020.11.12
IID 샘플 (0)	2020.11.04

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

DeepCampus

반복적인 기댓값 계산

'AI 수학 > 랜덤프로세스' 카테고리의 다른 글

댓글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

반복적인 기댓값 계산

'AI 수학 > 랜덤프로세스' 카테고리의 다른 글

관련글

댓글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역