728x90
반응형

데이터 분석/통계 4

표본 추출 방법

표본 추출 기법 표본조사의 중요한 점은 모집단을 대표할 수 있는 표본 추출이므로 표본 추출 방법에 따라 분석결과의 해석은 큰 차이가 발생한다. 확률적 표본 추출 : 모집단의 모든 기본단위가 선택 될 수 있는 동등한 기회를 의미하는 무작위 추출과정 단순무작위추출법(simple random sampling) 계통추출법(systematic sampling) 군집추출법(cluster random sampling) 층화추출법(stratified random sampling) 비확률적 표본 추출 : 일반화에 어려움이 있음 편의 추출법(convenience sampling, availability) 눈덩이 추출법 또는 연대 추출법(snowball sampling, word mouth) 할당추출법(quota sampl..

기술통계 vs 추리통계

1. 기술통계(Descriptive Statistics) Discriptive : 묘사하는, 그려서 설명하는 기술통계의 기술의 뜻은 서술하다 기술하다의 그 기술이다. 기술통계란? - 수집한 데이터를 요약하고 묘사 설명해서 내린 통계 기법 기술통계 기법 2가지 - 집중화 경향와 분산도 집중화 경향(Central tendency) : 수집한 데이터에서 대표하는 값이 무엇인지 또는 어떤 값에 집중되어 있는지를 다루는 기법. ex) 평균(mean), 중앙값(median), 최빈값(mode) 분산도(Variation) : 데이터가 전반적으로 어떻게 분포,분산되어 있는지(뭉쳐있는지, 퍼져있는지) 설명하는 방법. ex) 표준편차(standard deviation),사분위(quartile) 기술통계 기법을 통해 수집한..

통계 기본 단어 정리

1. 모집단과 모수 & 표본집단과 표본통계량 (Population, Parameter / Sample, Sample Statistic) 모집단 (Population) = 전체값 = 평소에 잘 알수가 없음. = 전체 집단의 모든 데이터를 알지 못하더라도, 수학적으로 그 분포를 기술할 수 있는 특성값 (=모수)들을 안다면 추측가능함. 모수(Parameter)의 종류 -평균 -분산/표준편차 -분위수(중위값,1분위수,4분위수 등) -모비율 등 표본집단 (Sample) = 모수를 추정하기 위해 모집단에서 추출한 샘플(일부) = 현실적으로 생각하면 모집단 전체에 대해 검사하기에는 비용이 너무 많이 들기 때문에 표본집단을 추출해 모수를 추정함 = 표본은 여러개 가능 = 그리고 매번 추출할 때마다 그 값이 달라짐. (..

상관분석(Correlation Analysis) : 상관관계로 분석하기

1. 의미 [위키백과] 상관분석은 확률론과 통계학에서 두 변수간에 어떤 선형적 관계를 갖고 있는 지를 분석하는 방법이다. 두 변수는 서로 독립적인 관계로부터 서로 상관된 관계일 수 있으며 이때 두 변수 간의 관계의 강도를 상관관계(Correlation, Correlation coefficient)라 한다. 상관분석에서는 상관관계의 정도를 나타내는 단위로 모상관계수로 p를 사용하며 표본 상관 계수로 r을 사용한다. 상관관계의 정도를 파악하는 상관계수(Correlation coeffecient)는 두 변수간의 연관된 정도를 나타낼 뿐 인과관계를 설명하진 않는다. 두 변수간의 원인과 결과의 인과관계가 있는지에 대한 것은 회귀분석을 통해 인관관계의 방향, 정도와 수학적 모델을 확인해 볼 수 있다. 2. 결과 상..

728x90
반응형