RL Researcher

Law of Large Numbers 본문

Reinfrocement Learning/Sutton RL

Law of Large Numbers

Lass_os 2021. 6. 6. 02:45
큰 population에서 무작위로 뽑은 sample average가 전체 population의 average와 가까울 가능성이 높다는 통계와 확률 분야의 기본 개념이다.

 

Week Law of Larfe Numbers라고도 한다

 

Law of Large Numbers는 population 전체를 조사, 관측하지 않더라도 population으로부터 충분히 큰 표본을 뽑아 sample average를 계산하면 그것이 모평균과 같아진다는 점을 보여주기 때문에, sample average를 통한 모평균의 예측방법(Generally, 표본 통계량을 통한 모수의 추정 방법)이 타탕함을 보여주는 매우 중요한 법칙임.

 

ex) 모든 학생의 평균 성적을 조사한다고 했을 때, 학교 전체를 조사할 수 없으므로 일정 학교만을 무작위추출하는 방식으로 표본을 만들어서 조사한다고 했을 때, 이때 조사하는 일정 인원의 수가 클수록, 100명개의 학교를 무작위로 뽑아서 조사하는 것보다는 1000개의 학교를 무작위로 뽑아서 조사할수록, 이 sample의 평균 성적이 전체 학생의 평균 성적에 가까워진다는 법칙.

 

# i.i.d sample : independent and identically distributed sample (independent이고 동일한 분포를 갖는 확률변수로 구성된 표본)

Comments