Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- machine learning
- 모두를 위한 RL
- 사이킷런
- 유니티
- 판다스
- 리스트
- pandas
- 데이터 분석
- 김성훈 교수님
- 강화학습
- Deep Learning
- list
- convex optimization
- ML-Agent
- Linear algebra
- unity
- Jacobian Matrix
- Python Programming
- Hessian Matrix
- Series
- 딥러닝
- David Silver
- paper
- reinforcement learning
- optimization
- neural network
- statistics
- 논문
- rl
- Laplacian
Archives
목록모두를 위한 RL (5)
RL Researcher
Lecture 1: Introduction
RL은 어떠한 것을 훈련시킬 때 많이 사용합니다. ex) 강아지를 훈련 실생활에서의 학습에 대해서 설명하고 있습니다. RL에는 크게 2가지로 나뉩니다. Environment Agent 기본적인 구조는 Agent가 Environment에서 어떤 Action을 하게 되는데, Action을 할 때 마다 State가 변경됩니다. 관찰정보가 달라집니다.(Observation or State) 어떠한 행동의 끝에는 치즈를 찾는 것이 목표일 때 매 순간마다 잘했다 못했다의 지표가 주어지는 것은 아니지만 일련의 Action을 하다 보면 치즈를 보상으로 받게 될 수 있습니다. 위의 책을 보시면 1997년의 책이지만 RL에 대해서 나와 있습니다. RL에 대해서는 엄청 오래 되었습니다. 그 전까지는 RL이 다른 학습 알고리..
Reinfrocement Learning/모두를 위한 RL
2021. 2. 9. 11:25