/*
-- Title : AutoML(Automated Machine Learning)
-- Reference : BDMBA, Microsoft
*/
■ AutoML이란?
모델을 선정하고 학습하는데 소모적인 부분과 반복적인 기계학습 모델 개발 단계를 자동화하는 프로세스를 말한다. ML 모델 개발에 많은 리소스와 많은 모델을 생성하고 각 도메인 영역의 지식과 시간이 필요한데 준비된 ML모델을 매우 쉽고 효과적으로 수행할 수 있다.
- Iternated Tasks 자동화
- 알고리즘 선택 및 파라미터 최적화
- 튜닝 자동화
- 최적 모델 추천
■ Standard ML vs. AutoML
Stnadard ML |
Auto ML |
- Data Preprocessing
- Feature Engineering
- Feature Extractions
- Feature Selection
|
- Data Preprocessing
- Feature Engineering
- Model Selection
- Hyperparameter Optimization
- Pipeline Selection
- Auto Selection of Evaluation Metric and Validation Procedures
- Problem Checking
- Analysis Result
- Offering User Interface and Visualization
|
■ AutoML Services & Solutions
ㅁ Cloud AutoML
구글에서 제공하는 AutoML로 API Interface를 통해 이미지와 자연어 처리, 번역, 정형데이터의 머신러닝 모델을 자동으로 빌드하고 배포할 수 있다
ㅁ Azure Machine Learning
마이크로소프트 Azure기반에서 제공하는 AutoML로 Azure ML Studio 기반에서 머신러닝 모델을 자동으로 빌드/배포할 수 있다.
ㅁ Auto-Keras
Texas A&M University Data Lab에서 개발한 것으로 딥러닝 모델에 대한 자동화된 아키텍처 및 하이퍼 파라미터 검색을 제공하고 이미지분류 ML을 지원한다.
ㅁ auto-Sklearn
자동화 된 scikit-learn 대안으로 Auto-sklearn은 베이지안 최적화, 메타 학습 및 앙상블 구성을 사용하고 이진분류, 다중 클래스 분류, 회귀 ML을 지원한다.
ㅁ automl-gs
Automl-gs는 Jinja 템플릿을 사용하여 원시 Python 코드를 생성하고 생성 된 코드를 사용하여 모델을 학습시키고 데이터 전처리 및 하이퍼 파라미터 튜닝을 제공한다. 이진분류, 다중 클래스 분류, 회귀분석 ML을 지원한다.
ㅁ Auto-Weka
WEKA를 사용한 자동화도니 기계학습으로 이진분류, 다중 클래스 분류, 회귀분석 ML을 지원한다.
ㅁ FeatureTools
Deep Feature Synthesis를 사용하여 관계형 및 시간 데이터에 대해 자동화 된 피처 엔지니어링(feature engineering)을 수행합니다.
ㅁ h2o automl
자동화 된 기능 사전 처리, 머신 러닝 모델 튜닝 및 학습을 제공하고 이진분류, 다중 클래스 분류, 회귀분석 ML을 지원한다.
ㅁ Ludwig
Ludwig는 우버(Uber)에서 만든 TensorFlow를 기반으로 구축 된 도구 상자로, 코드를 작성하지 않고도 딥 러닝 모델을 교육하고 테스트 할 수 있다. 테이블형식 데이터 분류나 회귀분석, 이미지 인식, NLP, 시계열 ML을 지원한다.
ㅁ mljar
mljar-supervised는 자동화 된 기능 전처리, 기계 학습 모델 튜닝 및 교육을 제공하고 다중 클래스 분류, 회귀분석, 이상 감지, 시계열, 진행중인 작업 ML을 지원한다.
ㅁ 신경망 인텔리전스 (NNI)
MSR(Microsoft Research)에서 제공하는 신경 아키텍처 검색 및 초 매개 변수 조정을 위한 AutoML 툴킷으로 NN을 로컬 또는 원격으로 훈련하는 데 도움된다. NN 아키텍처를 정의해야 하며 NNI를 조정하고 로컬/클라우드 훈련을 지원한다.
ㅁ tpot
유전 프로그래밍을 사용하여 머신 러닝 파이프 라인을 최적화하는 AutoML 도구로 이진분류, 다중 클래스 분류, 회귀분석 ML을 지원한다.
ㅁ TransmografAI
Apache Spark에서 머신 러닝 워크 플로를 빌드하기위한 AutoML 라이브러리로 이진분류, 다중 클래스 분류, 회귀분석 ML을 지원한다. 주요 저자로 Salsforce?