/*******************************************************************************************************************
-- Title : [NLP] Stanford CoreNLP vs. NLTK(StanfordPOSTagger) 비교
-- Key word : nlp mop stanford core nlp core nltk 스탠포드 maxenttagger stanford pos tagger
corenlp nltk tag stanford 자연어 처리 품사 형태소 분석 자연어처리 형태소분석
*******************************************************************************************************************/
■ Stanford CoreNLP 소개 : http://stanfordnlp.github.io/CoreNLP/
* POS Tagger 말고도, Java를 이용해 여러가지 NLP 관련 기능들을 제공함.
* 데모 페이지 : http://corenlp.run/
* POS Tagger에 대한 설명 : http://nlp.stanford.edu/software/tagger.html
■ Stanford Core NLP - MaxentTagger(java class)
* MaxentTagger의 javadoc : 참고 사이트
* 기본 목표 : 품사 태킹
* 생성자 : Tagger 모델 기반
MaxentTagger tagger = new MaxentTagger("
models/left3words-wsj-0-18.tagger");
■ 기본 사용법
■ 결과
■ NLTK : http://www.nltk.org/index.html
* Stanford Pos Tagger 외에도, 파이썬으로 NLP 프로그래밍을 할 수 있는 패키지 제공
■ NLTK로 Stanford POS Tagger 사용
* nltk.tag.stanford 소스코드 : http://www.nltk.org/_modules/nltk/tag/stanford.html
* 기본 목표 : 품사 태킹
■ 기본 사용법
■ 결과
※ 사용자 사전의 경우 좀 더 파악 필요.
NLTK에서는 현재 backoff tagger라는 키워드를 발견, 기본Tagger에 사용자Tagger를 backoff로 사용하는 방법으로 사료.
=> 정확한 사용법을 확인 중에 있음.
Stanford CoreNLP에서는 아직 못 찾음.