728x90
반응형
1. 모집단과 모수 & 표본집단과 표본통계량
(Population, Parameter / Sample, Sample Statistic)
- 모집단 (Population)
= 전체값
= 평소에 잘 알수가 없음.
= 전체 집단의 모든 데이터를 알지 못하더라도, 수학적으로 그 분포를 기술할 수 있는 특성값 (=모수)들을 안다면 추측가능함.
- 모수(Parameter)의 종류
-평균
-분산/표준편차
-분위수(중위값,1분위수,4분위수 등)
-모비율 등
- 표본집단 (Sample)
= 모수를 추정하기 위해 모집단에서 추출한 샘플(일부)
= 현실적으로 생각하면 모집단 전체에 대해 검사하기에는 비용이 너무 많이 들기 때문에 표본집단을 추출해 모수를 추정함
= 표본은 여러개 가능
= 그리고 매번 추출할 때마다 그 값이 달라짐. (표본집단을 100명중 15명으로 랜덤으로 뽑는다고 하면, 여러번 뽑을 때마다 매번 다른 15명이 뽑힐 것이다.)
= 추출된 표본들에게서 표본 통계량을 구할 수 있음
= 표본이 매번 추출할 때 마다 그 값이 변하는데, 표본 통계량도 역시나 매번 변함.
(표본 통계량은 모수의 '추정(수)치'로 볼 수 있고, 추정된 값은 항상 오차를 수반함)
- 표본 통계량(sample statistic)의 종류
-표본 평균
-표본 표준편차
-표본 비율
-표준 오차
(=표본 평균의 표준편차 = Standard Error of Mean(SEM))
헷갈리는 단어 주의
모수의 표준편차
표본통계량의 표준편차
표본통계량의 표본평균의 표준편차(=표준오차)
2. 확률과 확률분포
(Probability and Distributions)
조사 연구의 표준 : 동일한 조건에서의 반복 실험
- 실현값(outcome) : 실험의 결과
- 실험 실행 전에는 정확히 예측할 수 없음
- 표본공간(sample sapce) (=실험공간, experimental space) : 가능한 모든 실현값의 집합
- 확률실험(random experiment) : 실현값+표본공간+반복실험
- EX) 동전 던지기 : 실현값이 앞면과 뒷면 두가지 중 하나인 확률실험(표본공간:앞면,뒷면)
728x90
반응형
'데이터 분석 > 통계' 카테고리의 다른 글
표본 추출 방법 (0) | 2021.10.25 |
---|---|
기술통계 vs 추리통계 (0) | 2021.10.18 |
상관분석(Correlation Analysis) : 상관관계로 분석하기 (0) | 2021.06.18 |