RL Researcher

Statistics - Basic of Statistics 본문

Mathmatics/Machine Learning Statistics

Statistics - Basic of Statistics

Lass_os 2021. 6. 25. 13:44

What is Statistics?


모집단(Population)에서 표본(Sample)을 추출하여 표본을 분석해 모집단을 추정하고 추론하는 것.
  • 모집단 (Population) : 분석의 대상이 되는 모든 개체들을 모은 집합.
    • 일반적으로는 시간적이나 공간적인 제약이 존재하여 모집단 전체를 대상으로 분석은 불가능하다.
  • 표본 (Sample) : 모집단의 일부분의 관측값들을 추출한 것.

* 우리가 하게 되는 Statistics에서는 표본의 통계량(Statistic)을 통해서 모집단의 요약값인 Parameter를 추정하는 것이다.

  • 모수 (Parameter) : 표본을 통해서 뽑아낸 통계량을 이용해 수치로 표현되는 모집단의 특성.
  • 통계량 (Statistic) : 표본의 관측값들에 의해서 결정되는 양.

Types of Data


수치형(양적자료) 자료와 범주형(질적자료) 자료가 존재한다.
  • 수치형 (양적자료)
    • 연속형 : 몸무게, 키, ...
    • 이산형 : 전화 통화 수, ...
  • 범주형 (질적자료)
    • 순위형 : 학점, ...
    • 명목형 : 성별, ...

* 반응변수와 설명변수에 따라서 자료의 분석 방법을 정의할 수 있다.

반응변수 설명변수
범주형 연속형
범주형 (이분형) Chi Square Test Logistic Regression Analysis
연속형 Analysis of Variance Regression Analysis
  • 범주형 자료의 표현법 : 도수 분포표, 막대 or 원형 그래프
  • 연속형 자료의 표현법 : Box plot, Histogram

'Mathmatics > Machine Learning Statistics' 카테고리의 다른 글

[Statistics] Bayes' theorem  (1) 2021.03.16
분류(Classification)와 회귀(Regression)  (0) 2020.12.24
Comments