Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Series
- unity
- 사이킷런
- Python Programming
- Linear algebra
- 김성훈 교수님
- 딥러닝
- neural network
- 데이터 분석
- Deep Learning
- machine learning
- reinforcement learning
- 판다스
- pandas
- rl
- statistics
- 리스트
- 유니티
- 모두를 위한 RL
- Hessian Matrix
- ML-Agent
- convex optimization
- 논문
- Laplacian
- Jacobian Matrix
- list
- optimization
- paper
- David Silver
- 강화학습
Archives
목록Reinfrocement Learning/Sutton RL (1)
RL Researcher
Law of Large Numbers
큰 population에서 무작위로 뽑은 sample average가 전체 population의 average와 가까울 가능성이 높다는 통계와 확률 분야의 기본 개념이다. Week Law of Larfe Numbers라고도 한다 Law of Large Numbers는 population 전체를 조사, 관측하지 않더라도 population으로부터 충분히 큰 표본을 뽑아 sample average를 계산하면 그것이 모평균과 같아진다는 점을 보여주기 때문에, sample average를 통한 모평균의 예측방법(Generally, 표본 통계량을 통한 모수의 추정 방법)이 타탕함을 보여주는 매우 중요한 법칙임. ex) 모든 학생의 평균 성적을 조사한다고 했을 때, 학교 전체를 조사할 수 없으므로 일정 학교만을 무..
Reinfrocement Learning/Sutton RL
2021. 6. 6. 02:45