데이터 분석과 AI, 머신러닝, 딥러닝
/*
-- Title : 데이터 분석과 AI, 머신러닝, 딥러닝
-- Reference : BDMBA
*/
■ 데이터 분석 트랜드
•BI(Business Intelligence)
•BA(Business Analytics)
•AI(Artificail Intelligence)
■ 데이터 분석 영역
■ 인공지능 vs. 머신러닝 vs. 딥러닝
■ 머신러닝 개념
•학습(Learning)
•예측(Prediction)
■ 머신러닝 학습 유형
•지도학습(supervised learning)
•비지도학습(unsupervised learning)
•반지도학습(semi-supervised learning)
•강화학습(reinforcement learning)
■ 딥러닝 발전과정
■ 인공신경망
•활성함수(Activation function)
•sigmoid function
•hyper tangent function
•multi-layered perceptrons(MLP, 다층퍼셉트론)
■ CNN(convolution neural networks)
•이미지에서 객체, 얼굴, 장면을 인식하기 위해 패턴을 찾는 데 특히 유용
•자율 주행 자동차, 얼굴 인식 애플리케이션과 같이 객체 인식과 컴퓨터 비전이 필요한 분야에서 CNN을 많이 사용
•CNN은 특징을 직접 학습하기 때문에 특징을 수동으로 추출해야 할 필요가 없음
•CNN은 가장 높은 수준의 인식 결과를 보임
•기존 네트워크를 바탕으로 한 새로운 인식 작업을 위해 CNN을 재학습하여 사용하는 것이 가능
■ RNN(recurrent neural networks)
•RNN은 시계열 데이터에서 과거의 정보가 현재에 영향을 미치는 의존성을 학습하여 예측하는데 높은 성능을 보이고 있음
•RNN 알고리즘은 반복적이고 순차적인 데이터(Sequential data)학습에 특화된 인공신경망의 한 종류
•순환구조를 이용하여, 과거의 학습을 Weight를 통해 현재 학습에 반영
•음성 Waveform을 파악하거나(기계번역), 텍스트의 문장 앞 뒤성분을 파악할 때(Named Entity Recognition), 주로 사용
•단점은 처음시 작한 Weight의 값이 점차 학습이 될 수록 상쇄 된다는 것이였는데, 이를 보완한 알고리즘이 LSTM(Long Short Term Memory Network) 알고리즘
■ RMB(restricted boltzmann machine)
•딥러닝의 아버지 Geoff Hinton 교수가 이전 신경망의 여러 문제들, 특히 Vanishing Gradient 문제를 해결하기 위해 고안한 모델
•Unsupervised Learning이기 때문에 우선 data가 labeled 되어 있을 필요가 없음
•RBM을 특성(feature)을 추출하는 신경망이라고도 부르며 이것은 Autoencoder라고도 함