everyone。 我使用Baum-Welch算法來訓練pos tagger,它完全採用無監督的方式。 問題出在這裏: 當我得到標籤結果時,我只能得到一個數字序列。 我不知道哪個標籤代表VV,NN,DT。 我該如何解決這個問題?用於pos tagger的Baum-Welch算法
3
A
回答
4
一般來說,沒有辦法做到這一點。 Baum-Welch將找到具有相似分佈的詞類使用類,但沒有特別的理由可以假設這些類將以任何直接的方式映射到任何特定語言理論所提出的類別。因此,無監督的POS標籤主要用於你關心單詞或短語的等價類但不關於被分配的特定標籤的應用。
如果你真的需要人類可讀的標籤,但是(例如,在開發過程中,爲了評估你得到的結果是否是遠程合理的),我會手工標記幾十個句子。然後,您可以將您的B-W導出的標註器應用於標記爲小型語料庫的標籤,以誘導類編號和POS標籤之間的映射。
+0
在我看來,無監督的方式似乎不是一個很好的選擇來創建一個有用的pos標記。謝謝你的解釋!! – David 2011-03-12 13:00:04
相關問題
- 1. Pos Tagger in PHP
- 2. 刪除POS tagger的標籤
- 3. JCreator Java中的Standford POS tagger?
- 4. Stanford Spanish POS Tagger的含義
- 5. Stanford POS tagger:-filelist選項不起作用
- 6. 來自java程序的Stanford POS Tagger maxentTagger
- 7. 什麼是NLTK POS tagger要我下載?
- 8. Stanford POS tagger與GATE twitter模型很慢
- 9. 處理NLTK Stanford POS Tagger輸出
- 10. Stanford POS Tagger無法標記中文文本
- 11. 使用stanford pos tagger的阿拉伯語標記
- 12. 如何使用python pos tagger檢測關係
- 13. 如何在Python中使用nltk stanford pos tagger解析大數據
- 14. 如何在C#代碼中使用python NLP POS tagger?
- 15. 使用多個文本文件訓練Stanford POS tagger
- 16. 什麼算法用於Pascal中的Pos()函數?
- 17. 尋找POS-Tagger的HMM模型的準確性
- 18. 從skinned pos計算unskinned pos
- 19. 在Python中訓練TBL POS Tagger時的內存錯誤
- 20. 另一種語言的火車門POS tagger
- 21. 識別斯坦福POS Tagger中的搭配?
- 22. Java命令在NLTK Stanford POS Tagger中失敗
- 23. 韓國,泰國和印度尼西亞POS tagger
- 24. 如何在Python中將特定功能添加到CRF POS Tagger?
- 25. 我如何在斯坦福Pos tagger中創建我自己的模型?
- 26. 如何向Stanford POS-Tagger訓練有素的模型添加更多標記詞?
- 27. 按列計算POS標籤
- 28. 用於pos pc的.NET開發
- 29. 用於POS標記的NLP庫
- 30. 安裝用於POS的.Net插件2009
你在標註什麼語言? – dmcer 2011-03-08 04:12:52
你應該得到每個單詞的概率,然後你選擇一個概率最高的單詞。 – ealdent 2011-03-08 15:26:26
但是我不知道哪個標籤代表哪個pos標籤。我只得到1 2 3 5 2 3 – David 2011-03-09 11:24:41