본문 바로가기
AI 수학/랜덤프로세스

반복적인 기댓값 계산

by 깊은대학 2020. 12. 12.

랜덤변수(random variable) XY의 함수인 g(X,Y)의 기댓값 E[g(X,Y)]는 다음과 같이 조건부 기댓값을 두 번 반복하여 계산해서 구할 수 있다.

 

E[g(X,Y)]=EY[ EX[g(X,Y)|Y] ]

 

여기서 EX[]는 기댓값을 확률밀도함수 pX|Y(x|y)를 이용하여 계산한 것이고 EY[]는 기댓값을 pY(y)를 이용하여 계산한 것이다.

 

 

위 관계식을 증명해 보자.

 

EY[ EX[g(X,Y)|Y] ]=EX[g(X,Y)|Y=y] pY(y)dy=(g(x,y) pX|Y(x|y)dx) pY(y)dy=g(x,y) pX|Y(x|y) pY(y)dxdy=g(x,y) pXY(x,y)dxdy=E[g(X,Y)]

 

위 결과는 기댓값을 계산할 때 매우 유용하게 쓰인다.

 


예를 들면 E[X|Y]=Y2이고 Y의 확률밀도함수가 다음과 같이 주어졌을 때,

 

pY(y)={1,0y10,otherwise

 

X의 기댓값 E[X]를 계산해 보자. E[X]를 계산하기 위해서는 확률밀도함수 pX(x)가 필요한데 pX|Y(x|y)가 주어지지 않았으므로 pX(x)는 알 수 없다. 하지만 다음과 같이 반복적인 기댓값 계산 방법으로 E[X]를 계산할 수 있다.

 

E[X]=EY[EX[X|Y]]=y2 pY(y)dy=01y2 pY(y)dy=13

 

이번에는 조건부 분산(conditional variance) 예를 들어 보자.

 

 

랜덤변수 Yy로 주어졌을 때 X의 조건부 분산 Var(X|Y=y)는 확률밀도함수 pX|Y(x|y)를 이용한 X의 분산으로 정의하며 다음과 같이 주어진다.

 

Var(X|Y=y)=E[(XE[X|Y=y])2|Y=y]=E[X22XE[X|Y=y]+(E[X|Y=y])2|Y=y]=E[X2|Y=y]2E[X E[X|Y=y]]+E[(E[X|Y=y])2|Y=y]

 

여기서 두번째 항은.

 

E[X E[X|Y=y]|Y=y]=x E[X|Y=y] pX|Y(x|y)dx=x (xpX|Y(x|y)dx)pX|Y(x|y)dx=(xpX|Y(x|y)dx)x pX|Y(x|y)dx=(E[X|Y=y])2

 

이므로 분산은 다음과 같이 된다.

 

Var(X|Y=y)=E[X2|Y=y](E[X|Y=y])2

 

 

랜덤변수 Var(X|Y)는 랜덤변수 Y의 함수로서 Yy값을 취하면 조건부 분산 Var(X|Y=y)가 된다. 따라서 랜덤변수 Var(X|Y)의 기댓값은 다음과 같이 계산된다.

 

EY[Var(X|Y)]=EY[E[X2|Y](E[X|Y])2]=E[X2]EY[(E[X|Y])2]

 

위 식의 첫번째 항에 반복적인 기댓값 계산 방법을 적용하였다.

한편, 랜덤변수 E[X|Y]도 랜덤변수 Y의 함수로서 Yy값을 취하면 조건부 기댓값은 E[X|Y=y]가 된다. 따라서 랜덤변수 E[X|Y]의 분산은 다음과 같이 계산할 수 있다.

 

Var(E[X|Y])=EY[(E[X|Y]EY[E[X|Y]])2]=EY[(E[X|Y])22E[X|Y] EY[E[X|Y]]+(EY[E[X|Y]])2]=EY[(E[X|Y])2](EY[E[X|Y]])2=EY[(E[X|Y])2](E[X])2

 

마찬가지로 위 식의 두번째 항에 반복적인 기댓값 계산 방법을 적용하였다.

랜덤변수 Var(X|Y)의 기댓값과 랜덤변수 E[X|Y]의 분산을 더하면 다음과 같이 된다.

 

EY[Var(X|Y)]+Var(E[X|Y])=E[X2](E[X])2=Var(X)

 

위 식을 조건부 분산의 법칙이라고 한다.

 

 

'AI 수학 > 랜덤프로세스' 카테고리의 다른 글

랜덤변수의 함수와 샘플링 - 2  (0) 2020.12.24
랜덤변수의 함수와 샘플링 - 1  (0) 2020.12.22
베이즈(Bayes) 정리  (0) 2020.11.13
샘플평균과 샘플분산  (0) 2020.11.12
IID 샘플  (0) 2020.11.04