Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- optimization
- Deep Learning
- list
- Linear algebra
- 리스트
- unity
- 모두를 위한 RL
- 유니티
- pandas
- Hessian Matrix
- rl
- 딥러닝
- 논문
- reinforcement learning
- 김성훈 교수님
- 사이킷런
- 판다스
- Laplacian
- David Silver
- 데이터 분석
- ML-Agent
- statistics
- convex optimization
- Python Programming
- Jacobian Matrix
- Series
- 강화학습
- machine learning
- paper
- neural network
Archives
목록independent and identically distributed sample (1)
RL Researcher
Law of Large Numbers
큰 population에서 무작위로 뽑은 sample average가 전체 population의 average와 가까울 가능성이 높다는 통계와 확률 분야의 기본 개념이다. Week Law of Larfe Numbers라고도 한다 Law of Large Numbers는 population 전체를 조사, 관측하지 않더라도 population으로부터 충분히 큰 표본을 뽑아 sample average를 계산하면 그것이 모평균과 같아진다는 점을 보여주기 때문에, sample average를 통한 모평균의 예측방법(Generally, 표본 통계량을 통한 모수의 추정 방법)이 타탕함을 보여주는 매우 중요한 법칙임. ex) 모든 학생의 평균 성적을 조사한다고 했을 때, 학교 전체를 조사할 수 없으므로 일정 학교만을 무..
Reinfrocement Learning/Sutton RL
2021. 6. 6. 02:45