如果我想製作一個像NLTK這樣的NLP工具包,那麼在標記化和標準化後我會首先實現哪些功能。 POS標籤或Lemmatisation?以實施順序排在第一位:POS標記或Lemmatisation?
1
A
回答
2
詞性對於工作的語法化非常重要,因爲根據詞性的不同,詞語具有不同的含義。使用這些信息,詞形將返回基本形式或引理。所以,如果POS標籤的實施首先完成,那將會更好。
lemmatisation背後的主要思想是將一個單詞的不同變形形式組合成一個。例如,去,去,去了和去了將成爲只有一個 - 去。但是爲了推導這一點,lemmatisation必須知道單詞的背景 - 無論單詞是名詞還是動詞等。
因此,lemmatisation函數可以將單詞和詞性作爲輸入並返回引理處理完信息後。
2
確定首先使POS標記。如果您首先進行雙重化,您可能會在執行POS標記時丟失單詞的最佳分類,特別是在語言中,歧義很常見,因爲它是葡萄牙語。
相關問題
- 1. SQL以自定義排序順序加入第一條記錄
- 2. MPI排序實施
- 3. POS應用程序中的平均價格實施?
- 4. 獲取列數據類型,排序方向onload,更改排序順序在第一次單擊標題在tablesorter
- 5. 使用RNN的POS標記
- 6. 如何標記爲spacy的Sence2vec實施
- 7. 在pos標記後提取形容詞
- 8. 優化週期排序實施
- 9. 快速排序實施嘗試
- 10. 實施選擇排序與載體
- 11. 計數排序 - 實施差異
- 12. 排序實施的鏈接列表
- 13. 實施快速排序的錯誤
- 14. 實施多圓柱數組排序
- 15. 「類」單位實施
- 16. Excel的排序順序 - 特殊字符不是第一個
- 17. Crystal Reports如何實現排序順序
- 18. 如何在更改另一列排序順序時保持rownum排序順序?
- 19. 在圖中按順序標記點
- 20. 排序順序
- 21. SQL索引標識列排序順序
- 22. PhoneGap或Appcelerator實施
- 23. 鍵出現在第二一個和標記這一事實
- 24. 按訪問順序排列的MS Access標記重複項
- 25. 轉換第二階微分方程,以第一順序
- 26. 傑基爾排在第一位?
- 27. 以排序順序生成隨機數
- 28. 排序或順序排序列表<T> [] c#使用Linq
- 29. c排隊,排序順序
- 30. 按第三列確定的順序排列一對列
您是否介意我可以如何整合POS標籤來幫助我進行詞形化呢? – Djokester
好的,我更新了答案,請檢查您是否在尋找 –