728x90
반응형
1. 기술통계(Descriptive Statistics)
- Discriptive : 묘사하는, 그려서 설명하는
- 기술통계의 기술의 뜻은 서술하다 기술하다의 그 기술이다.
기술통계란? - 수집한 데이터를 요약하고 묘사 설명해서 내린 통계 기법
기술통계 기법 2가지 - 집중화 경향와 분산도
- 집중화 경향(Central tendency) : 수집한 데이터에서 대표하는 값이 무엇인지 또는 어떤 값에 집중되어 있는지를 다루는 기법.
ex) 평균(mean), 중앙값(median), 최빈값(mode) - 분산도(Variation) : 데이터가 전반적으로 어떻게 분포,분산되어 있는지(뭉쳐있는지, 퍼져있는지) 설명하는 방법.
ex) 표준편차(standard deviation),사분위(quartile)
기술통계 기법을 통해 수집한 데이터의 전체적인 모양을 그릴 수 있다. 데이터의 대표값은 무엇인지, 혹은 분산을 통해 편차가 얼마나 큰지 등.
파이썬 코드 : df.describe()
2. 추리통계(Inferential statistics)
- Inferential : 추론의,추정에 의한
추리통계란? - 수집한 데이터를 바탕으로 어떤 것을 추론하고 예측하는데 사용하는 통계 기법
ex) 대통령선거 - 누가 당선 될 것인가에 대한 예측 (확률)
추리통계 기법 - 전체집단에서 표본을 샘플링 후 통계를 내려 추론,추리
- 모집단(Population), 모수(Parameter), 통계(Statistic), 추정량(Estimator),표본(Sample), 표준편차(Standard Deviation),표준오차(Standard Error) 등
t-test , chi-square test 등을 사용
한마디로 기술통계란 평균,중앙값,최빈값,표준편차,사분위 등으로 있는 사실에 대해 통계를 내린 것! 추리통계는 더 나아가 기술통계를 바탕으로 알고자 하는 사실을 추론하고 예측!
728x90
반응형
'데이터 분석 > 통계' 카테고리의 다른 글
표본 추출 방법 (0) | 2021.10.25 |
---|---|
통계 기본 단어 정리 (0) | 2021.10.18 |
상관분석(Correlation Analysis) : 상관관계로 분석하기 (0) | 2021.06.18 |