일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 딥러닝
- Hessian Matrix
- Jacobian Matrix
- unity
- list
- 판다스
- neural network
- 강화학습
- optimization
- Linear algebra
- 유니티
- reinforcement learning
- 논문
- 데이터 분석
- 모두를 위한 RL
- 사이킷런
- 리스트
- machine learning
- ML-Agent
- David Silver
- rl
- convex optimization
- statistics
- pandas
- Deep Learning
- Laplacian
- Python Programming
- 김성훈 교수님
- Series
- paper
목록분류 전체보기 (88)
RL Researcher
1. 머신러닝과 강화학습 머신러닝은 크게 3가지로 분류가 됩니다. 지도학습(Supervised Learning) 비지도학습(Unsupervised Learning) 강화학습(Reinforcement Learning) 지도학습(Supervised Learning) : "정답"을 알고 있는 데이터를 이용해 컴퓨터(Machine)를 학습시킵니다. 컴퓨터(Machine)는 자신이 낸 답과 정답의 차이를 통해 지속해서 학습합니다. Ex) 회귀분석(Regression), 분류(Classification) 비지도학습(Unsupervised Learning) : 지도학습과는 다르게 정답이 있는 것이 아닙니다. 데이터가 주어지면 비슷한 것끼리 묶어주는 식의 학습이 비지도 학습입니다. 비지도학습은 정답이 없이 주어진 데이..
1. 피처 스케일링 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업을 피처 스케일링(feature scaling)이라고 합니다. 대표적인 방법으로 표준화(Standardization)와 정규화(Normalization)가 있습니다. 표준화(Standardization)는 데이터의 피처 각각 평균이 0이고 분산이 1인 Gaussian 정규분포를 가진 값으로 변환하는 것을 의미합니다. 표준화를 통해 변환될 피처 x의 새로운 i번째 데이터를 x(i)(new)라고 한다면 이 값은 원래 값에서 피처 x의 평균을 뺀 값을 피처 x의 표준편차로 나눈 값으로 계산할 수 있습니다. $$x_{i}(new) = \frac{x_{i}-mean(x)}{stdev(x)}$$ 일반적으로 정규화는 서로 다른 피처의 크기를 ..
1. Data Encoding 머신러닝을 위한 대표적인 인코딩 방식은 레이블 인코딩(Label encoding)과 원-핫 인코딩(One Hot encoding)이 있습니다. 레이블 인코딩(Label encoding) Label encoding은 카테고리 피처를 코드형 숫자 값으로 변환하는 것입니다. 예를 들어 상품 데이터의 상품 구분이 TV,냉장고, 전자레인지, 컴퓨터, 선풍기, 믹서 값으로 되어 있다면 TV : 1, 냉장고 : 2, 전자레인지 : 3, 컴퓨터 : 4, 선풍기 : 5, 믹서 : 6과 같은 숫자형 값으로 변환하는 것입니다. 2. Label encoding Label encoding을 코드로 구현해 보겠습니다. from sklearn.preprocessing import LabelEncode..
1. Cross-Validation이란? 간략히 먼저 설명하자면 본고사를 치르기 전에 모의고사를 여러번 보는 것입니다. 즉, 본고사가 테스트 데이터 세트에 대해 평가하는 거라면 모의고사는 교차검증에서 많은 학습과 검증 세트에서 알고리즘 학습과 평가를 수행하는 것입니다. Machine Learning은 데이터에 기반합니다. 그리고 데이터는 이상치, 분포도, 다양한 속성값, 피처 중요도 등 여러가지 Machine Learning에 영향을 미치는 요소를 가지고 있습니다. 특정 Machine Learning 알고리즘에서 최적으로 동작할 수 있도록 데이터를 선별하여 학습한다면 실제 데이터 양식과는 많은 차이가 있을 것이고 결국은 성능저하로 이어질 가능성이 매우 높습니다. 교차 검증(Cross-validation)..