'Planning by Dynamic Programming' 태그의 글 목록

Processing math: 100%

본문 바로가기

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

관리 메뉴

목록Planning by Dynamic Programming (1)

RL Researcher

Lecture 3: Planning by Dynamic Programming

동적 계획법은 큰 문제를 작은문제들로 나누고 작은 문제들의 해결책들을 찾은 후 모아 큰 문제를 푸는 것입니다. 동적 계획법의 두가지 조건에 대해서 보겠습니다. 큰 문제가 작은 문제들로 나뉠 수 있어야 합니다. Subproblem을 풀면 문제에 대한 정답을 저장해 두었다가 나중에 재사용합니다. MDP는 위 두 조건을 만족합니다. 동적 계획법은 MDP의 모든 지식을 알고 있습니다. 동적 계획법이 MDP의 계획에 사용됩니다. 쉽게 생각하면, Prediction은 value function을 찾는 문제이고, Control문제는 policy를 찾는 문제입니다. Prediction의 경우 입력: MDP $그리고 정책 $\pi$ 또는: MRP$ 출력 : 가치함수 $v_{\pi}$ Control의 경우 입력: ..

Reinfrocement Learning/David-Silver Lecture 2021. 2. 2. 12:53

Prev 1 Next

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

RL Researcher

목록Planning by Dynamic Programming (1)

RL Researcher

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역