사이킷런 기반 프레임워크(2) 사이킷런의 주요 모듈

머신러닝 (Machine Learning)/python Scikit-learn library

사이킷런 기반 프레임워크(2) 사이킷런의 주요 모듈

DS지니 2021. 2. 7. 18:41

728x90

자주쓰이는 핵심 모듈 위주입니다.

분류	모듈명	설명
예제 데이터	sklearn.datasets	사이킷런에 내장되어 예제로 제공하는 데이터 세트
피처 처리	sklearn.preprocessing	데이터 전처리에 필요한 다양한 가공 기능 제공 (인코딩, 정규화, 스케일링 등)
	sklearn.feature_selection	알고리즘에 큰 영향을 미치는 피처를 우선순위대로 설렉션 작업을 수행하는 다양한 기능 제공
	sklearn.feature_extraction sklearn.feature_extraction.text (텍스트데이터) sklearn.feature_extraction.image (이미지 데이터)	텍스트 데이터나 이미지 데이터의 벡터화된 피처를 추출하는데 사용함. (예를 들어 텍스트 데이터에서 Count Vectiorizer나 Tf-Idf Vectiorizer 등을 생성하는 기능 제공.)
피처 처리 & 차원 축소	sklearn.decomposition	차원 축소와 관련한 알고리즘을 지원하는 모듈. (PCA,NMF, Truncated SVD
데이터 분리, 검증 & 파라미터 튜닝	sklearn.model_selection	교차 검증을 위한 train/test 데이터 분리, 그리드 서치(GridSearch)로 최적 파라미터 추출 등의 API 제공
평가	sklearn.metrics	분류,회귀,클러스터링,페어와이즈(Pairwise)에 대한 다양한 성능 측정 방법 제공 (Accuracy, Precision, Recall, ROC-AUC, RMSE 등)
ML 알고리즘	sklearn.ensemble	앙상블 알고리즘 제공. (랜덤포레스트, 에이다부스트, 그래디언트 부스팅 등)
	sklearn.linear_model	주로 선형회귀, 릿지(Ridge), 라쏘(Lasso) 및 로지스틱 회귀 등 회귀 관련 알고리즘을 지원. 또한 SGD(Stochastic Gradient Descent) 관련 알고리즘도 제공
	sklearn.naive_bayes	나이브 베이즈 알고리즘 제공. 가우시안 NB, 다항분포 NB 등.
	sklearn.neighbors	최근접 이웃 알고리즘 제공, K-NN 등
	sklearn.svm	서포트 벡터 머신 알고리즘 제공
	sklearn.tree	의사 결정 트리 알고리즘 제공
	sklearn.cluster	비지도 클러스터링 알고리즘 제공 (K-평균, 계층형,DBSCAN 등)
유틸리티	sklearn.pipline	피처 처리 등의 변환과 ML알고리즘 학습, 예측 등을 함께 묶어서 실행할 수 있는 유틸리티 제공

일반적으로 머신러닝 모델을 구축하는 주요 프로세스는 피처 처리(feature processing), ML 알고리즘 학습/예측 수행, 그리고 모델 평가의 단계를 반복적으로 수행하는 것입니다.

사이킷런 패키지는 머신러닝 모델을 구축하는 주요 프로세스를 지원하기 때문에 매우 편리하고 다양하며 유연한 모듈을 지원합니다. 이러한 편리성, 다양성, 유연성이 바로 많은 ML 개발자가 사이킷런을 파이썬 기반의 ML 개발 프레임워크로 선택하게 된 이유일 것입니다.

728x90

'머신러닝 (Machine Learning) > python Scikit-learn library' 카테고리의 다른 글

Model Selection 모듈(학습/테스트 분리,교차검증) (0)	2021.02.10
사이킷런으로 데이터 전처리(결손값,인코딩,스케일) (0)	2021.02.07
사이킷런 기반 프레임워크(3) 사이킷런에 내장된 예제 데이터 세트 (0)	2021.02.07
사이킷런 기반 프레임워크(1) Estimator, fit(), predict() 메서드 (0)	2021.02.07
사이킷런 특징과 설치법 (0)	2021.02.07

현재글사이킷런 기반 프레임워크(2) 사이킷런의 주요 모듈

데이터 분석하는 지니 🏃‍♀️ https://github.com/gggggeun https://velog.io/@gggggeun1

khaiii, anaconda3, TensorFlow, Jupyter Notebook, Python, 카카오분석기, 파이썬프로그램, 설치안됨, 에러 error, regexp_replace, 문자열 치환, cloud, chromedrivermanager, error, DataFrame, webdriver_manager, str_to_date, CASE WHEN, 쿼리 순서, SQL,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

DS Note