2014-11-01 129 views
0

我使用Stanford POS taggerGATE Twitter model和標記器需要大約3秒來初始化,這是正常還是我正確加載它?Stanford POS tagger與GATE twitter模型很慢

小樣本代碼:

package tweet.nlp.test; 

import edu.stanford.nlp.tagger.maxent.MaxentTagger; 

public class TweetNLPTest { 

    public static void main(String[] args) { 
     String text = "My sister won't tell me where she hid my food. She's fueling my anorexia. #bestsisteraward #not "; 

     MaxentTagger tagger = new MaxentTagger("models/gate-EN-twitter.model"); 

     String taggedText = tagger.tagString(text); 
    } 
} 

輸出:

從模型讀取POS惡搞模型/門EN-twitter.model ... 警告:沒有語言集,沒有指定開放類標籤,也沒有指定封閉類標籤;假設所有標籤都是開放類標籤 完成[3.1秒]。

My_PRP $ sister_NN won't_MD tell_VB me_PRP where_WRB she_PRP hid_VBD my_PRP $ food._NN She's_VBZ fueling_VBG my_PRP $ anorexia._NN #bestsisteraward_HT #not_HT _HT BUILD SUCCESSFUL (總時間:3秒)

+1

看起來正常的我。 – Yasen 2014-11-02 07:51:14

+0

@Yasen我想也許我沒有這樣做,因爲GATE模型擴展名爲'.model',而其他模型擴展名爲'.tagger'。這不需要做任何事情嗎? – 2014-11-02 12:36:46

回答

2

對我來說,看起來很正常,初始化大約需要2到3秒。 .tagger.model相同。

你可以看到它在斯坦福標註器提供的樣本模型:

model = wsj-0-18-bidirectional-nodistsim.tagger 
+0

那麼,至少我發現有人給代表:P – 2014-11-27 16:29:34

+0

其他事情,我真的不明白,如果你想使用GATE API,但如果是這樣,你可以創建一個新的StanfordTaggerPR像'PR =(LanguageAnalyser) Factory.createResource(「gate.stanford.Tagger」,params,features);' – 2014-11-27 17:12:47

+0

好的,謝謝! – 2014-11-27 17:42:09