RL Researcher

분류(Classification)와 회귀(Regression) 본문

Mathmatics/Machine Learning Statistics

분류(Classification)와 회귀(Regression)

Lass_os 2020. 12. 24. 16:04
분류(Classification)와 회귀(Regression)는 지도학습(Suprevised Learning)의 목적이라 할 수 있습니다.

지도학습이란?

입력과 출력 데이터(train data)가 있고, 이를 모델화하여 새로운 데이터에 대해 정확한 출력을 예측하는 것입니다.

1. 분류(Classification)


분류는 미리 정의된, 가능성이 있는 여러 클래스 레이블 중 하나를 예측하는 것입니다.

sklearn의 dataset 중 붓꽃의 품종을 예측하는 것은 분류에 속합니다. 가장 대표적인 예로는 스팸메일을 분류하는 것이 있습니다.

분류(Classification)의 종류

1-1 이진분류(binary classification)


이진 분류를 쉽게 설명하자면 그렇다 / 아니다 2개로 분류하는 것이니다. 이때 결과가 '그렇다' 이면 1로 표현하고, '아니다'이면 0으로 표현합니다.( 고양이다 / 고양이가 아니다)

1-2 다중 분류(Multiclass classification)


위에서 말한 sklearn의 dataset 중 붓꽃 데이터의 경우 3개의 클래스를 가지고 있기 때문에 다중 분류 입니다.

다중 분류란 이진분류처럼 그렇다 / 아니다 가 아닌 두개 이상의 클래스를 구별하는데 사용합니다. 

2. 회귀(Regression)


출력 값에 연속성이 있다면 회귀 문제라고 할 수 있습니다. 예를 들어 연봉을 예상할 때 1억이든 1억 1만원이든 큰 문제가 되지 않습니다.

회귀란 어떤 데이터가 어떠한 함수로부터 생성되어 있는가를 알아보는 것입니다.( 변수 사이의 관계를 알아보는 방법입니다.)

 

이번에는 쉽게 알아보고 다음에는 선형 회귀 등 다양하게 알아보겠습니다.

'Mathmatics > Machine Learning Statistics' 카테고리의 다른 글

Statistics - Basic of Statistics  (0) 2021.06.25
[Statistics] Bayes' theorem  (1) 2021.03.16
Comments