본문 바로가기
AI 수학/랜덤프로세스

랜덤변수의 함수와 샘플링 - 1

by 깊은대학 2020. 12. 22.

Y가 랜덤변수(random variable) X의 함수 Y=g(X)로 주어진다면 Y도 랜덤변수가 된다. X의 누적분포함수 FX(x)와 확률밀도함수 pX(x)로부터 FY(y)pY(y)를 구해보자.

 

 

 

사건 {Yy}의 확률은 랜덤변수 Xg(X)y를 만족하는 실수 구간 {XIx}에 속할 확률과 같으므로 Y의 누적분포함수는 다음 식으로 계산할 수 있다.

 

FY(y)=P{Yy}=P{g(X)y}=P{Xg1(y)}=P{XIx}

 

예를 들어서 다음과 같은 랜덤변수 XY의 함수 관계가 있다고 가정하자.

 

Y=2X+3

 

그러면 Y의 누적분포함수는 다음과 같이 계산할 수 있다.

 

FY(y)=P{Yy}=P{2X+3y}=P{X12(y3)}=FX(y32)

 

만약 X[0,1] 구간에서 균등분포(uniform distribution)을 갖는다면, 즉 XU[0,1]이라면

 

pX(x)={1,0x10,others

 

Y의 확률밀도함수는 다음과 같이 계산할 수 있다.

 

pY(y)=dFY(y)dy=ddy[FX(y32)]=12pX(y32)={12,3y50,others

 

 

 

 

 

다른 예를 들어보자. 이번에는 다음과 같은 함수 관계가 있다고 가정하자.

 

Y=g(X)={2X,0X<1222(1X),12X10,others

 

 

 

그러면 Y의 누적분포함수는 다음과 같다.

 

FY(y)=P{Yy}=P{g(X)y}=P{Xg1(y)}=P{Xy22,0y<1X112(2y)2,1y2X0,others={FX(y22),0y<1FX(112(2y)2),1y20,others

 

따라서 Y의 확률밀도함수는 다음과 같이 계산할 수 있다.

 

pY(y)=dFY(y)dy={ddy[FX(y22)],0y<1ddy[FX(112(2y)2)],1y20,others={y pX(y22),0y<1(2y) pX(112(2y)2),1y20,others

 

만약 X[0,1] 구간에서 균등분포(uniform distribution)을 갖는다면,

 

pY(y)={y,0y<1(2y),1y20,others

 

이 된다.

 

 

어떤 확률분포를 가진 랜덤변수에서 데이터를 생성하는 과정을 샘플링(sampling)이라고 한다. 파이썬(Python)이나 매트랩(Matlab)에는 가우시안 확률분포나 균등 확률분포를 갖는 랜덤변수에서 샘플을 추출할 수 있는 함수를 제공한다. 그렇다면 임의의 확률분포에서는 어떻게 샘플링 할 수 있을까.

랜덤변수 Y의 확률분포를 알고 있지만 샘플을 직접 추출하기 어려운 경우에는 균등 확률분포를 갖는 랜덤변수 X로부터 추출한 샘플 X=x(i)을 함수 관계식 y(i)=g(x(i))로 변환해서 Y로부터 추출한 샘플 Y=y(i)로 간주하면 된다.

예를 들어서, 균등 확률분포를 갖는 X로부터 추출한 N개의 샘플 x(i)로부터 다음과 같이 함수 y=g(x)를 통해 Y의 샘플 y(i)를 구할 수 있다.

 

y=g(x)={2x,0x<1222(1x),12x10,others

 

다음 그림은 100,000개의 샘플 x(i)y(i)를 이용해 근사적인 확률밀도함수를 그린 것(히스토그램)이다. 해석적으로 구한 확률밀도함수와 거의 일치함을 알 수 있다.

 

 

 

'AI 수학 > 랜덤프로세스' 카테고리의 다른 글

랜덤변수의 함수와 샘플링 - 3  (0) 2020.12.26
랜덤변수의 함수와 샘플링 - 2  (0) 2020.12.24
반복적인 기댓값 계산  (0) 2020.12.12
베이즈(Bayes) 정리  (0) 2020.11.13
샘플평균과 샘플분산  (0) 2020.11.12

댓글