728x90
반응형
1. 머신러닝(지도학습)
지도학습은 레이벨(Label) or 타겟(Target) 이라고 하는 명시적인 정답이 있는 데이터가 주어진 상태에서 학습하는 머신러닝 방식입니다. 지도학습은 2종류로 나뉘는데 회귀(Regression)과 분류(Classification) 입니다.
머신러닝(Machine Learning) | 지도학습 | 분류(Classification) | 이산 값 (class labels) |
회귀(Regression) | 연속 값 (number) | ||
비지도학습 |
※ 지도학습의 머신러닝 모델 만드는 과정
학습 데이터(Train data)로 주어진 데이터의 Feature와 Target을 머신러닝 알고리즘으로 학습해 모델을 생성(Fit) 하고, 이렇게 생성된 모델에 새로운 데이터 값(Test data)이 주어졌을 때 미지의 Target 값을 예측(Predict) 하는 것 입니다.
즉, 기존 데이터가 어떤 레이블에 속하는지 패턴을 알고리즘으로 인지한 뒤에 새롭게 관측된 데이터에 대한 레이블을 판별하는 것 입니다.
2. 분류란?
분류(Classificaiton)와 회귀(Regression)의 차이점은 Label(=Target, 예측할 값)의 상태이다.
Label이 이산값(이진분류(0또는1, True또는False), 멀티분류)인 경우는 분류알고리즘모델로 예측한다.
Label이 연속값인 경우는 회귀알고리즘모델로 예측한다.
3. 분류의 다양한 머신러닝 알고리즘
분류 알고리즘 | 설명 |
로지스틱 회귀 (Logistic Regression) |
독립변수와 종속변수의 선형 관계성에 기반한 알고리즘 |
결정트리 (Decision Tree) |
데이터 균일도에 따른 규칙 기반의 알고리즘 |
나이브 베이즈 (Naive Bayes) |
베이즈(Bayes) 통계와 생성 모델에 기반한 알고리즘 |
서포트 벡터 머신 (Support Vector Machine) |
개별 클래스 간의 최대 분류 마진을 효과적으로 찾아주는 알고리즘 |
최소 근접 알고리즘 (Nearest Neighbor) |
근접 거리를 기준으로 하는 알고리즘 |
신경망 (Neural Network) |
심층 연결 기반의 알고리즘 |
앙상블 (Ensemble) |
서로 다른(또는 같은) 머신러닝 알고리즘을 결합한 알고리즘 |
728x90
반응형
'머신러닝 (Machine Learning) > 분류(Classification) 분석' 카테고리의 다른 글
결정 트리의 과적합 (Overfitting) 시각화로 이해하기 (0) | 2021.02.14 |
---|---|
Decision Tree Graphviz (0) | 2021.02.14 |
결정 트리 (Decision Tree) (0) | 2021.02.13 |
분류의 평가(Evaluation) (2) F1 score , ROC AUC (0) | 2021.02.13 |
분류의 평가(Evaluation) (1) Confusion Matrix, Accuracy, Precision, Recall (0) | 2021.02.11 |