반응형

/*******************************************************************************************************************
-- Title : [NLP] Stanford CoreNLP vs. NLTK(StanfordPOSTagger) 비교
-- Key word : nlp mop stanford core nlp core nltk 스탠포드 maxenttagger stanford pos tagger
                  corenlp  
nltk tag stanford 자연어 처리 품사 형태소 분석 자연어처리 형태소분석
*******************************************************************************************************************/

■ Stanford CoreNLP 소개 : 
http://stanfordnlp.github.io/CoreNLP/

    

    * POS Tagger 말고도, Java를 이용해 여러가지 NLP 관련 기능들을 제공함.
    * 데모 페이지 : 
http://corenlp.run/
    * POS Tagger에 대한 설명 : http://nlp.stanford.edu/software/tagger.html

 Stanford Core NLP - MaxentTagger(java class)
    * MaxentTagger의  javadoc : 참고 사이트
    * 기본 목표 : 품사 태킹
      

    * 생성자 : Tagger 모델 기반
      MaxentTagger tagger = new MaxentTagger("

models/left3words-wsj-0-18.tagger");



 기본 사용법

    


■ 결과

    

 



■ NLTK : http://www.nltk.org/index.html

   


    * Stanford Pos Tagger 외에도, 파이썬으로 NLP 프로그래밍을 할 수 있는 패키지 제공

■ NLTK로 Stanford POS Tagger 사용
    * nltk.tag.stanford 소스코드 : http://www.nltk.org/_modules/nltk/tag/stanford.html
    * 기본 목표 : 품사 태킹
      


■ 기본 사용법

    


■ 결과 

     



※ 사용자 사전의 경우 좀 더 파악 필요.
    NLTK에서는 현재 backoff tagger라는 키워드를 발견, 기본Tagger에 사용자Tagger를 backoff로 사용하는 방법으로 사료. 

    => 정확한 사용법을 확인 중에 있음.


    Stanford CoreNLP에서는 아직 못 찾음.






반응형

+ Recent posts