RL Researcher

결정계수(coeffcient of determination, R2) 본문

Machine-Learning/Algorithm

결정계수(coeffcient of determination, R2)

Lass_os 2020. 12. 27. 17:39

1. 결정계수(R2)


결정계수(R2)는 회귀모형의 예측능력을 평가하는 대표적인 지표입니다. 결정계수는 추정한 선형 모형이 주어진 자료에 적합한 정도를 재는 척도입니다. 반응 변수(Y)의 분산 중에서 적합한 모형이 설명가능한 부분의 비율을 말합니다.

$$R^{2} = \frac{SSR}{SST} = \frac{1- SSE}{SST}$$
결정계수(R2)의 범위는 0 ~ 1 까지며 수식에서 보듯이 예측모형의 편차가 전체 데이터의 편차를 모두 대신할 수 있으면 결정계수(R2)가 1입니다. 즉 모형의 예측 정확도가 높아지면 결정계수가 1에 가까워진다는 의미입니다. ( 0에 가까울수록 설명력이 낮고, 1에 가까울수록 설명력이 높다.)

2. SST


SST 는 Sum of Square Total로 편차의 제곱합입니다. SST의 수식을 보겠습니다.
$$SST = \sum (y_{i}-\hat{y_{i}})^{2}$$

3. SSE


SSE는 Sum of Square Error로 회귀식과 실제값의 차이를 말합니다. SSE의 수식을 보겠습니다.
$$SSE = \sum (y_{i}-\bar{y})^{2}$$

4. SSR


SSR은 Sum of Square Regression으로 회귀식과 평균값의 차이를 의미합니다. 위의 그림을 보면 파란선과 빨간선이 엇갈리며 차이가 발생하는 것을 확일할 수 있다. SSR이 높아질수록 R-squared가 높아집니다.
$$SSR = \sum (\hat{y_{i}}-\bar{y})^{2}$$

SST는 모든 차이의 합이며, 이것이 SST와 SSR이라고 합니다. 즉 SST = SSE + SSR로 표현할 수 있습니다.

Comments