'동적 계획법' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Tags more

Archives

관리 메뉴

목록동적 계획법 (1)

RL Researcher

Lecture 3: Planning by Dynamic Programming

동적 계획법은 큰 문제를 작은문제들로 나누고 작은 문제들의 해결책들을 찾은 후 모아 큰 문제를 푸는 것입니다. 동적 계획법의 두가지 조건에 대해서 보겠습니다. 큰 문제가 작은 문제들로 나뉠 수 있어야 합니다. Subproblem을 풀면 문제에 대한 정답을 저장해 두었다가 나중에 재사용합니다. MDP는 위 두 조건을 만족합니다. 동적 계획법은 MDP의 모든 지식을 알고 있습니다. 동적 계획법이 MDP의 계획에 사용됩니다. 쉽게 생각하면, Prediction은 value function을 찾는 문제이고, Control문제는 policy를 찾는 문제입니다. Prediction의 경우 입력: MDP $$ 그리고 정책 $\pi$ 또는: MRP $$ 출력 : 가치함수 $v_{\pi}$ Control의 경우 입력: ..

Reinfrocement Learning/David-Silver Lecture 2021. 2. 2. 12:53

Prev 1 Next

목록동적 계획법 (1)

RL Researcher

티스토리툴바