/*******************************************************************************************************************
-- Title : Classification에서의 앙상블 모델이란?
-- Reference : datacenter
-- Key word : classification 분류 앙상블 모델 ensemble model
*******************************************************************************************************************/

 ■ Classification 에서 앙상블 모델이란? 

 
음악에서 여러 사람이 화음을 만들어 곡을 완성하는 협주와 같이 
분류기 모델을 여러개 만들어놓고 동시에 분류를 시킨 후에 다수결 방식으로 정답일 가능성이 높은 것을 고르는 방식입니다. 
 
아래 점선 사각형 박스에서 처럼 다른 종류의 분류모델들이 있을 수 있고

 

 
어떤 한 문서에 대해 클래스를 예측할 때 문서를  a클래스 인지 b클래스인지 예측할때 분류모델 1,2,3 이 a라고 예측했고 분류모델 4가 b라고 예측 했을때
분류기 결과를 종합하여 이 문서를 a라고 출력해주는 기법입니다.
연산량이 증가하지만 성능을 극도로 끌어 올려야 할때 필수적으로 사용됩니다.
 
 
 
  • Multiple stage approach
 
첫번째 가정은 일반적인 딥러닝의 end to end 방법이 아닌 
파이프라인으로 여러 단계 나눠푸는 것을 말하는 것으로 생각됩니다.

머신러닝 파이프 라인
 
 
머신러닝을 위한 데이터 소스와 흡수
위키본 리서치(Wikibon Research)의 분석가 조지 길버트가 설명했듯이 머신러닝 파이프라인은 4개의 단계로 구성된다.
1. 데이터 흡수
2. 데이터 준비(데이터 탐색 및 거버넌스 포함)
3. 모델 학습
4. 예측 제공
 

 
multiple stage approach가 파이프라인 별로 나눠서 문제를 푸는 것인지 아니라면 
한번에 나누어야 할 class수를 줄이기 위해서 단계를 나눈다는 뜻인지는 조금 더 알아봐야 할 것 같습니다.
 
한번에 나누어야 할 class 수를 줄이기 위해서 단계를 나눈다는 뜻이라면
KSIC 을 예측하는 단계를 대,중,소,세 분류로 단계를 따로 설계해서  한번에 나누어야 할 클래스 수를 줄인다는 뜻이 될 것 같습니다.

 

+ Recent posts