™ '빅데이터' 관련 핵심 참고 사이트
NLP References
○ NLP : GIF로 Scikit-Learn을 이용한 클러스터링
○ NLP : Text Classification with Word2Vec
○ NLP : Free ebooks by Project Gutenberg
○ NLP : Latent Dirichlet Allocation (LDA) with Python
○ NLP : 5-Heroic Python Libraries
○ NLP : Word Embedding의 직관적 이해 - Count Vector에서 Word2Vec까지
○ NLP : CLARK GRUBB의 다양한 NLP 처리 내역
○ NLP : spaCy - Industrial-strength NLP in Python
○ NLP : TextBlob 0.12.0 - Simplified Text Processing Python
○ NLP : 단어 임베딩의 원리와 gensim.word2vec 사용법
○ NLP : [DSBA] Softmax Classification, Window classification and Neural network
○ NLP : 텍스트 분석 초보자를 위한 10가지 NLP 용어
○ NLP : 단어를 숫자로! Google의 Word2Vec
○ NLP : SK플래닛의 자연어처리와 오피니언 마이닝 플랫폼 소개
○ NLP : Google 자연어처리 오픈소스 SyntaxNet
○ NLP : IBM Watson Knowledge Studio
○ NLP : NIA(한국정보화진흥원), 형태소 사전 'NIADic'
○ NLP : 비정형 데이터를 기반으로 한 필요기술 및 적용 사례
○ NLP : Word2Vec 그리고 추천 시스템의 Item2Vec
ML, DL and AI References
○ ML : sklearn을 이용한 다양한 알고리즘 구현 샘플
○ ML : sklearn.datasets.load_iris를 이용한 다양한 알고리즘 구현 샘플
○ ML : Python을 활용한 K-Means 및 기타 클러스터링 알고리즘 구현
○ MS-ML : Microsoft Machine Learning API (Cortana Intelligence Gallery)
○ MS-ML : SQL Server as a Machine Learning Model Management System
○ ML : 특허분석을 위한 머신러닝(Clustering, Classification, Spatial Concept Maps)
○ ML : Finding Outliers & Modified Boxplots 1.5(IQR) Rule
○ ML : Machine Learning vs. Rules Based System
○ DL : 카카오 AI 리포트 - 세상을 바꾸고 싶다면, 딥러닝
○ ML/DL : Basic Machine/Deep Learning with Tensorflow (Python)
○ DL : Tensorflow for Deep Learning Research
○ ML : Microsoft Machine Learning Studio
○ DL : Introduction to Deep Learning
Bigdata and Platform References
○ NewSQL : CrateDB Documentation
○ ElasticSearch : ElasticSearch + SparkSQL 연동
○ ElasticSearch : '시작해요! 엘라스틱서치' 예제 코드
○ NoSQL : 대량데이터 동시처리위한 DBMS 종류와 특징
○ PostgreSQL : pg_shard - Shard and Scale out
○ ColumnarDB : 9 Best Open Source Column Store Projects
○ SparkML : 스파크용 오픈소스 머신러닝 라이브러리 '스파크 ML'
○ ColumnarDB : MariaDB ColumnStore vs. ClickHouse vs. Apache Spark Benchmarks
○ ColumnarDB : MariaDB ColumnStore vs. InnoDB vs. MonetDB
○ BigData : 2017년 빅데이터와 BI 트랜드
○ DFS : Compare Splunk Cloud vs. Hadoop HDFS
○ OpenSource : 2016년 분야별 최고의 오픈소스 Awards
○ ColumnarDB : 마리아DB, 빅데이터 분석위한 '마리아DB Columnstore 1.0'
○ DW : Big data, Data Mining, Data Warehouse
Statistics and Algorithm References
○ SQL : Cosine Similarity in MS-SQL Server
○ AL : 기계 학습 엔지니어가 알아야 할 10가지 알고리즘
○ Stats : 베이지안 통계 첫걸음○ AL : Maximum Entropy Classifier
○ MS-R : ML Templates with SQL Server R Services
○ NLP : 자바, 미안하다! KOrean NLP with PYthon
○ PY : www.pythonprogramming.net