Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 김성훈 교수님
- Hessian Matrix
- 강화학습
- Jacobian Matrix
- 모두를 위한 RL
- neural network
- statistics
- rl
- David Silver
- optimization
- Series
- 데이터 분석
- Linear algebra
- 사이킷런
- paper
- Python Programming
- 논문
- 리스트
- Deep Learning
- ML-Agent
- unity
- machine learning
- pandas
- convex optimization
- list
- 판다스
- Laplacian
- 유니티
- 딥러닝
- reinforcement learning
Archives
목록IID (1)
RL Researcher
Law of Large Numbers
큰 population에서 무작위로 뽑은 sample average가 전체 population의 average와 가까울 가능성이 높다는 통계와 확률 분야의 기본 개념이다. Week Law of Larfe Numbers라고도 한다 Law of Large Numbers는 population 전체를 조사, 관측하지 않더라도 population으로부터 충분히 큰 표본을 뽑아 sample average를 계산하면 그것이 모평균과 같아진다는 점을 보여주기 때문에, sample average를 통한 모평균의 예측방법(Generally, 표본 통계량을 통한 모수의 추정 방법)이 타탕함을 보여주는 매우 중요한 법칙임. ex) 모든 학생의 평균 성적을 조사한다고 했을 때, 학교 전체를 조사할 수 없으므로 일정 학교만을 무..
Reinfrocement Learning/Sutton RL
2021. 6. 6. 02:45