일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 리스트
- Hessian Matrix
- Series
- 논문
- 데이터 분석
- Python Programming
- paper
- 판다스
- neural network
- David Silver
- Jacobian Matrix
- Linear algebra
- list
- Deep Learning
- convex optimization
- 강화학습
- 김성훈 교수님
- ML-Agent
- rl
- 유니티
- reinforcement learning
- 사이킷런
- unity
- optimization
- 모두를 위한 RL
- machine learning
- 딥러닝
- statistics
- pandas
- Laplacian
목록ML-Agent (2)
RL Researcher
Website : github.com/Unity-Technologies 1. Background : Machine Learning ML-Agents Toolkit의 많은 사용자가 공식적인 기곗 학습 배경이 없을 수 있다는 점을 감안할 때 이 페이지에서는 ML-Agents Toolkit을 쉽게 이해할 수 있도록 개요를 제공합니다. 그러나 온라인에 환상적인 리소스가 있으므로 기계 학습에 대한 철저한 처리를 제공하지 않을 것입니다. 인공지능의 한 분야인 ML은 데이터에서 학습 패턴에 중점을 둡니다. ML Algorithm의 세가지 주요 클래스는 Unsupervised Learning, Supervised Learning, Reinforcement Learning입니다. Algorithm의 각 클래스는 다른 유..
1. 머신러닝(ML)이란? 기계학습 또는 머신러닝은 인공지능의 한 분야입니다. 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야 대량의 데이터나 알고리즘을 통해 '학습'을 시켜 수행하는 방식입니다. (기초 데이터를 주지 않아도 스스로 학습을 통하여 결과를 추측해냅니다.) 2. 학습의 종류 강화학습(PPO) 모방학습 커리큘럼 학습 관찰학습 3. Unity ML - Agent 훈련 주기 Agent의 행동 Environment(환경)의 상태 변경 Agent에게 보상을 제공 4. Unity ML - Agent 내부 구조 Agent 각각의 Agent는 고유의 상태 및 관측 값을 가지고 있습니다. Environment내에서 고유의 행동을 수행하며 Enviornment에서 일어나는 이벤트에 따라 고유의..