머신러닝 (Machine Learning)/분류(Classification) 분석

분류(Classification)

DS지니 2021. 2. 4. 22:31
728x90
반응형

1. 머신러닝(지도학습)

지도학습은 레이벨(Label) or 타겟(Target) 이라고 하는 명시적인 정답이 있는 데이터가 주어진 상태에서 학습하는 머신러닝 방식입니다. 지도학습은 2종류로 나뉘는데 회귀(Regression)과 분류(Classification) 입니다. 

머신러닝(Machine Learning) 지도학습 분류(Classification) 이산 값 (class labels)
회귀(Regression) 연속 값 (number)
비지도학습    

 

※ 지도학습의 머신러닝 모델 만드는 과정

 

학습 데이터(Train data)로 주어진 데이터의 Feature와 Target을 머신러닝 알고리즘으로 학습해 모델을 생성(Fit) 하고, 이렇게 생성된 모델에 새로운 데이터 값(Test data)이 주어졌을 때 미지의 Target 값을 예측(Predict) 하는 것 입니다.

즉, 기존 데이터가 어떤 레이블에 속하는지 패턴을 알고리즘으로 인지한 뒤에 새롭게 관측된 데이터에 대한 레이블을 판별하는 것 입니다.

Regression 에서도 다뤘던 그림을 가져와 보았습니다.

2. 분류란?

분류(Classificaiton)와 회귀(Regression)의 차이점은 Label(=Target, 예측할 값)의 상태이다.

Label이 이산값(이진분류(0또는1, True또는False), 멀티분류)인 경우는 분류알고리즘모델로 예측한다.

Label이 연속값인 경우는 회귀알고리즘모델로 예측한다.

 

3. 분류의 다양한 머신러닝 알고리즘

분류 알고리즘 설명
로지스틱 회귀
(Logistic Regression)
독립변수와 종속변수의 선형 관계성에 기반한 알고리즘
결정트리
(Decision Tree)
데이터 균일도에 따른 규칙 기반의 알고리즘
나이브 베이즈
(Naive Bayes)
베이즈(Bayes) 통계와 생성 모델에 기반한 알고리즘
서포트 벡터 머신
(Support Vector Machine)
개별 클래스 간의 최대 분류 마진을 효과적으로 찾아주는 알고리즘
최소 근접 알고리즘
(Nearest Neighbor)
근접 거리를 기준으로 하는 알고리즘
신경망
(Neural Network)
심층 연결 기반의 알고리즘
앙상블
(Ensemble)
서로 다른(또는 같은) 머신러닝 알고리즘을 결합한 알고리즘

 

728x90
반응형