Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Hessian Matrix
- 모두를 위한 RL
- paper
- Deep Learning
- list
- Python Programming
- ML-Agent
- neural network
- statistics
- 데이터 분석
- 논문
- 판다스
- 유니티
- unity
- Jacobian Matrix
- 딥러닝
- Laplacian
- Linear algebra
- 리스트
- machine learning
- convex optimization
- Series
- reinforcement learning
- 사이킷런
- David Silver
- rl
- pandas
- 강화학습
- 김성훈 교수님
- optimization
Archives
RL Researcher
분류(Classification)와 회귀(Regression) 본문
Mathmatics/Machine Learning Statistics
분류(Classification)와 회귀(Regression)
Lass_os 2020. 12. 24. 16:04분류(Classification)와 회귀(Regression)는 지도학습(Suprevised Learning)의 목적이라 할 수 있습니다.
지도학습이란?
입력과 출력 데이터(train data)가 있고, 이를 모델화하여 새로운 데이터에 대해 정확한 출력을 예측하는 것입니다.
1. 분류(Classification)
분류는 미리 정의된, 가능성이 있는 여러 클래스 레이블 중 하나를 예측하는 것입니다.
sklearn의 dataset 중 붓꽃의 품종을 예측하는 것은 분류에 속합니다. 가장 대표적인 예로는 스팸메일을 분류하는 것이 있습니다.
분류(Classification)의 종류
1-1 이진분류(binary classification)
이진 분류를 쉽게 설명하자면 그렇다 / 아니다 2개로 분류하는 것이니다. 이때 결과가 '그렇다' 이면 1로 표현하고, '아니다'이면 0으로 표현합니다.( 고양이다 / 고양이가 아니다)
1-2 다중 분류(Multiclass classification)
위에서 말한 sklearn의 dataset 중 붓꽃 데이터의 경우 3개의 클래스를 가지고 있기 때문에 다중 분류 입니다.
다중 분류란 이진분류처럼 그렇다 / 아니다 가 아닌 두개 이상의 클래스를 구별하는데 사용합니다.
2. 회귀(Regression)
출력 값에 연속성이 있다면 회귀 문제라고 할 수 있습니다. 예를 들어 연봉을 예상할 때 1억이든 1억 1만원이든 큰 문제가 되지 않습니다.
회귀란 어떤 데이터가 어떠한 함수로부터 생성되어 있는가를 알아보는 것입니다.( 변수 사이의 관계를 알아보는 방법입니다.)
이번에는 쉽게 알아보고 다음에는 선형 회귀 등 다양하게 알아보겠습니다.
'Mathmatics > Machine Learning Statistics' 카테고리의 다른 글
Statistics - Basic of Statistics (0) | 2021.06.25 |
---|---|
[Statistics] Bayes' theorem (1) | 2021.03.16 |
Comments