본문 바로가기
AI수학/확률과 추정

랜덤변수의 함수와 샘플링 - 2

by 세인트워터멜론 2020. 12. 24.

랜덤변수(random variable) \(X\)의 확률밀도함수(pdf, probability density function) \(p_X (x) \)이고, 랜덤변수 \(Y\)가 미분가능한 함수 \(Y=g(X)\)로 주어졌을 때, \(Y\)의 확률밀도함수 \(p_Y (y)\)는 다음과 같이 주어진다.

 

\[ p_Y (y) = \sum_{i=1}^k \frac{p_X (x_i)}{ \left| g^{\prime} (x_i) \right| } \]

 

여기서 \(x_1,x_2, ... \)는 함수 \(y=g(x)\)의 해이고 \(g^\prime (x_i)\)는 \(x_i\)에서 함수 \(g\)를 미분한 값이다. 증명은 복잡하므로 생략하기로 한다.

 

 

위 식을 이용하여 \(g\)가 선형함수 \(Y=aX+b,\ a \gt 0 \) 일 때, \(p_Y (y)\)를 구해보자. 먼저 함수 \(g\)의 해를 구해보면,

 

\[ x=\frac{y-b}{a} \]

 

로서 1개이다.

 

 

이 값에서 함수 \(g\)의 미분값 \(g^\prime (x)\)는 다음과 같다.

 

\[ g^\prime (x)=a \]

 

따라서 \(Y\)의 확률밀도함수 \(p_Y (y)\)는 다음과 같다.

 

\[ p_Y (y)= \frac{1}{|a|} p_X \left( \frac{y-b}{a} \right) \]

 

만약 \(X\)가 가우시안(Gaussian) 분포를 갖는다면, 즉 \( X \sim N(\mu,\sigma ^2) \), 또는

 

\[ p_X (x)= \frac{1}{\sqrt{2 \pi \sigma ^2}} \exp \left[ - \frac{(x-\mu)^2}{2 \sigma ^2 } \right] \]

 

\(Y\)의 확률밀도함수 \(p_Y (y)\)는 다음과 같이 계산된다.

 

\[ \begin{align} p_Y (y) &= \frac{1}{ |a| } p_X \left( \frac{y-b}{a} \right) \\ \\ &= \frac{1}{ |a| } \frac{1}{ \sqrt{ 2 \pi \sigma ^2 } } \exp \left[ - \frac{ \left( \frac{y-b}{a} - \mu \right)^2 }{ 2 \sigma ^2 } \right] \\ \\ &= \frac{1}{ \sqrt{ 2 \pi (a \sigma )^2 }} \exp \left[ - \frac{ (y-b-a \mu )^2 }{ 2 a^2 \sigma^2 } \right] \end{align} \]

 

따라서 \(Y\)도 다음과 같은 평균과 분산을 갖는 가우시안 분포가 된다.

 

\[ Y \sim N(a \mu +b, a^2 \sigma ^2) \]

 

위 결과를 이용하면 정규 분포 \(N(0,1)\)을 갖는 랜덤변수로부터 임의의 평균과 분산을 갖는 가우시안 샘플을 생성할 수 있다.

또다른 예를 들어보자. \(g\)가 이차함수 \(Y=X^2\)일 때, \(p_Y (y)\)를 구해보자. 먼저 함수 \(g\)의 해를 구해보면,

 

\[ x= \pm \sqrt{y} \]

 

로서 2개다.

 

 

이 값에서 함수 \(g\)의 미분값 \(g^\prime (x)\)는 각각 다음과 같다.

 

\[ g^\prime (x)= \pm 2 \sqrt{y} \]

 

따라서 Y의 확률밀도함수 \(p_Y (y)\)는 다음과 같다.

 

\[ p_Y (y)= \frac{1}{ 2\sqrt{y} } p_X (\sqrt{y} ) + \frac{1}{ 2\sqrt{y} } p_X (-\sqrt{y} ) \]

 

 

 

만약 랜덤변수 \(V,W\)가 두 개의 랜덤변수 \(X,Y\)의 함수 \(V=g(X,Y), \ W=h(X,Y)\)로 주어졌다면, \(V,W\)의 결합 확률밀도함수(joint pdf) \(p_{VW} (v,w)\)는 다음과 같이 \(X,Y\)의 결합 확률밀도함수 \(p_{XY} (x,y)\)로 부터 구할 수 있다.

 

\[ p_{VW} (v, w)= \sum_{i=1}^k \frac{ p_{XY} (x_i, y_i) }{ \left| J_i \right|} \]

 

여기서 \(x_1, x_2, ..., y_1, y_2, ... \)는 함수 \(v=g(x,y), \ w=h(x,y)\)의 해이고 \( \left| J_i \right| \)는 다음과 같이 주어지는 자코비안 행렬 \(J_i\)의 행렬식(determinant)이다.

 

\[ J_i = \begin{bmatrix} \frac{\partial g}{\partial x_i} & \frac{\partial g}{\partial y_i} \\ \frac{\partial h}{\partial x_i} & \frac{\partial h}{\partial y_i} \end{bmatrix} \]

 

여기서 편미분은 \(x_i\) 또는 \(y_i\)에서 함수 \(g\)와 \(h\)를 미분한 값이다 증명은 복잡하므로 역시 생략하기로 한다.

예를 하나 들어본다. 다음과 같이 두 개의 함수가 주어졌다.

 

\[ \begin{align} v &= g(x,y)= 3x+5y \\ \\ w &= h(x,y)=x+2y \end{align}\]

 

랜덤변수 \(X,Y\)의 결합 확률밀도함수가 \(p_{XY} (x,y)\)일 때, 랜덤변수 \( V=g(X,Y)\), \(W=h(X,Y) \)의 결합 확률밀도함수 \(p_{VW} (v,w) \)를 구해보자. 먼저 함수 \(g, h\)의 해를 구해보면,

 

\[ \begin{align} x &= 2v-5w \\ \\ y &= -v+3w \end{align}\]

 

로서 1쌍이다. 자코비안 행렬 \(J_i\)의 행렬식을 구하면, .

 

\[ J_i = \begin{vmatrix} \frac{\partial g}{\partial x_i} & \frac{\partial g}{\partial y_i} \\ \frac{\partial h}{\partial x_i} & \frac{\partial h}{\partial y_i} \end{vmatrix} =\begin{vmatrix} 3 & 5 \\ 1 & 2 \end{vmatrix} = 1 \]

 

이다. 따라서 결합 확률밀도함수 \(p_{VW} (v,w)\)는 다음과 같이 된다.

 

\[ \begin{align} p_{VW} (v, w) &= \sum_{i=1}^k \frac{ p_{XY} (x_i, y_i) }{ \left| J_i \right|} \\ \\ &= p_{XY} (2v-5w, \ -v+3w) \end{align} \]

 

만약 \( \ p_{XY} (x,y)= (2 \pi )^{-1} \exp \left[ -\frac{1}{2} (x^2+y^2 ) \right] \)이라면,

 

\[ \begin{align} p_{VW} (v, w) &= p_{XY} (2v-5w, \ -v+3w) \\ \\ & = \frac{1}{2\pi } \exp \left[ (2v-5w)^2 + (-v+3w)^2 \right] \\ \\ & = \frac{1}{2\pi } \exp \left[ - \frac{1}{2} (5v^2-26vw+34w^2) \right] \end{align} \]

 

이 된다.

 

 

댓글0