일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- reinforcement learning
- 논문
- 데이터 분석
- rl
- Python Programming
- Deep Learning
- 리스트
- 모두를 위한 RL
- David Silver
- list
- Laplacian
- Linear algebra
- paper
- 판다스
- 강화학습
- ML-Agent
- machine learning
- statistics
- 김성훈 교수님
- unity
- Hessian Matrix
- neural network
- Series
- 사이킷런
- Jacobian Matrix
- convex optimization
- pandas
- 딥러닝
- optimization
- 유니티
목록분류 전체보기 (88)
RL Researcher
Convex sets affine and convex sets some important examples operations that preserve convexity generalized inequalities separating and supporting hyperplanes dual cones and generalized inequalities Affine set 아래에 그림의 x1과 x2를 통하는 모든 점들을 Affine set이라고 부름. x=θx1+(1−θ)x2 (θ∈R) affine set : set에서 두 개의 다른 점을 통과하는 선을 포함함. example : linear equations $\le..
Question 1 The symbol x⋆ usually denotes a feasible point the optimal value of the problem a solution Question 2 Least squares is a special case of convex optimization. true false Question 3 Almost any problem you'd like to solve in practice is convex. true false Question 4 Convex optimization problems are attractive because they always have a unique solution. true false Question 5 In device siz..
1.1 Mathematical optimization 수학적 최적화 문제, 또는 그냥 최적화 문제는 다음과 같은 형식을 가집니다. vector x=(x1,...,xn) called optimization variable(최적화 변수). function f0:Rn→R called objective function(목적함수). function fi:Rn→R, i=1,...,m called (inequality)constraint functions(부등식)제약함수. constant b1,...,bm constraints에 대한 limits or bounds. vector x∗은 called so..
강화학습에 대한 공부를 하던 중 다 공부하던 것들은 재생목록에서 지우다 보니 기록을 남겨야겠다 싶어서 작성합니다. 강의 모두를 위한 RL - 김성훈 교수님의 강의 팡요랩 강의 혁펜하임 강의 (수학적 정의를 보고싶으신 분들은 여기를 참조 부탁드립니다.) Deep Mind Reinforcement Learning Lecture CS234 : Reinforcement Learning SNU Reinforcement Learning Lecture Deep RL BootCamp 2017 Deep Reinforcement Learning : CS 285 Fall 2020 POSTECH Reinforcement Learning