2016-10-10 79 views

回答

1

是的,但不是開箱即用:您可以在布朗語料庫上訓練您自己的標記器。性能將取決於您需要標記的文本類型以及您嘗試使用不同類型的標記器時需要付出多少努力。 NLTK書的Chapter 5將逐步引導您製作一個相當不錯的標記器的過程(特別是關於N-Gram Tagging的部分),它甚至使用布朗語料庫作爲示例 - 您不需要更改一個東西。

+0

謝謝。我嘗試使用棕色語料庫來訓練UnigramTagger – user3606057

+0

這很好,但Unigram tagger幾乎沒用:它只是用最常見的POS標記每個單詞。繼續閱讀,直到你到達trigram taggers(儘管你的表演可能在bigrams之後變平)。 – alexis

+0

我如何訓練tagger爲了有效? – user3606057