Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 강화학습
- ML-Agent
- neural network
- paper
- Hessian Matrix
- 김성훈 교수님
- Linear algebra
- reinforcement learning
- 사이킷런
- unity
- 논문
- convex optimization
- 모두를 위한 RL
- Jacobian Matrix
- list
- 리스트
- Deep Learning
- machine learning
- Series
- 딥러닝
- Laplacian
- David Silver
- Python Programming
- rl
- 데이터 분석
- 판다스
- pandas
- 유니티
- optimization
- statistics
Archives
목록Stochastic (1)
RL Researcher
Lecture 5: Windy Frozen Lake Nondeterministic world!
실제 Frozen Lake문제는 바람이 부는 Frozen Lake문제입니다. Agent가 $s$에서 시작한다고 했을 때, 강의 환경을 알지 못합니다. 잘하면 $s_{1}$이라는 State에 도착을 하겠지만, 바람도 심하게 불고 미끄럽기 때문에 아래쪽이나 2칸을 더 가게되는 상황이 발생할 수 있습니다. 그래서 오른쪽으로 갈려고 해도 항상 오른쪽으로 가지는 것이 아닙니다. 우리는 위에서 설명한 이것을 nondeterministic 즉 Stochastic이라고 부릅니다. 오른쪽으로 간다고 했을 때 오른쪽으로 갈수 없을 수도 있으며 다른 위치에 도착해 있을 수도 있기 때문에 보상도 다를 수 있습니다. 우리가 이전까지 했던 바람이 불지않는 Frozen Lake는 Deterministic Game이라고 부릅니다. ..
Reinfrocement Learning/모두를 위한 RL
2021. 2. 10. 01:09