디랙 델타(Dirac delta) 함수
여기서
그러면 랜덤변수(random variable)
여기서
여기서
만약
여기서는 물론
먼저
위 식의 오른쪽에서 두번째 항은,
이므로, 원래 식은 다음과 같이 된다.
따라서
이 된다. 즉, 샘플 평균을 이용해서 계산한 분산이 기댓값을 이용해서 계산한 분산보다도 항상 작다는 것을 알 수 있다. 이를 샘플 분산의 과소 추정 문제라고 한다.
또한 샘플 평균을 이용해서 계산한 분산은 실제 분산의 바이어스된(biased) 추정값이다. 증명해 보자.
여기서
가 되어서 샘플 평균은 바이어스없이 기댓값을 추정한다고 할 수 있다.
이번에는 샘플 분산
여기서
이다. 따라서
결국
가 성립하므로, 바이어스 없는 분산값을 얻기 위해서는 샘플 분산 계산시에

정리하면 바이어스 없는 샘플 평균과 샘플 분산은 다음과 같이 계산하면 된다.
'AI 수학 > 랜덤프로세스' 카테고리의 다른 글
랜덤변수의 함수와 샘플링 - 1 (0) | 2020.12.22 |
---|---|
반복적인 기댓값 계산 (0) | 2020.12.12 |
베이즈(Bayes) 정리 (0) | 2020.11.13 |
IID 샘플 (0) | 2020.11.04 |
조건부 확률 (0) | 2020.10.27 |
댓글