일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- statistics
- ML-Agent
- Hessian Matrix
- rl
- 강화학습
- reinforcement learning
- 논문
- Laplacian
- Deep Learning
- Python Programming
- paper
- Jacobian Matrix
- 사이킷런
- 유니티
- 데이터 분석
- Series
- unity
- list
- Linear algebra
- 김성훈 교수님
- David Silver
- 딥러닝
- convex optimization
- optimization
- neural network
- 판다스
- 모두를 위한 RL
- machine learning
- 리스트
- pandas
목록Machine-Learning/Preprocessing (2)
RL Researcher
1. 피처 스케일링 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업을 피처 스케일링(feature scaling)이라고 합니다. 대표적인 방법으로 표준화(Standardization)와 정규화(Normalization)가 있습니다. 표준화(Standardization)는 데이터의 피처 각각 평균이 0이고 분산이 1인 Gaussian 정규분포를 가진 값으로 변환하는 것을 의미합니다. 표준화를 통해 변환될 피처 x의 새로운 i번째 데이터를 x(i)(new)라고 한다면 이 값은 원래 값에서 피처 x의 평균을 뺀 값을 피처 x의 표준편차로 나눈 값으로 계산할 수 있습니다. $$x_{i}(new) = \frac{x_{i}-mean(x)}{stdev(x)}$$ 일반적으로 정규화는 서로 다른 피처의 크기를 ..
1. Data Encoding 머신러닝을 위한 대표적인 인코딩 방식은 레이블 인코딩(Label encoding)과 원-핫 인코딩(One Hot encoding)이 있습니다. 레이블 인코딩(Label encoding) Label encoding은 카테고리 피처를 코드형 숫자 값으로 변환하는 것입니다. 예를 들어 상품 데이터의 상품 구분이 TV,냉장고, 전자레인지, 컴퓨터, 선풍기, 믹서 값으로 되어 있다면 TV : 1, 냉장고 : 2, 전자레인지 : 3, 컴퓨터 : 4, 선풍기 : 5, 믹서 : 6과 같은 숫자형 값으로 변환하는 것입니다. 2. Label encoding Label encoding을 코드로 구현해 보겠습니다. from sklearn.preprocessing import LabelEncode..