我正在尋找一種很好的方法來從使用SQL或C#的頁面上的文本中提取相關關鍵字。我打算用這些鏈接將這些關鍵字鏈接到網站的其他部分以導航到相關內容。這在一些博客中看起來很常見。使用c#或SQL從文本中提取關鍵字
2
A
回答
2
一個簡單的方法可能是使用C#下載到內存中,過濾掉HTML標籤,Javascript等(即識別真實內容),將其分解爲單獨的單詞,過濾器與高頻出現的單詞列表在任何通用書面文件中,計算文件中出現的每個單詞的頻率,將出現最多的單詞作爲關鍵詞。
您需要隨着時間的推移開發您的過濾詞列表。
根據您的域名,可能會更恰當地採用相反的方式,並建立一個特定於域的關鍵字列表(或關鍵字組,以便識別「安全帶」和「安全帶」等)作爲同一個詞),並找出每個詞或詞組在給定文檔中出現的次數。那些超過某個閾值,或者前5個或者其他什麼的將是與該文檔相關的關鍵字。
0
有來自Joseph Turian一個很好的信息回答這個問題的更一般的版本:How do I extract keywords used in text?
相關問題
- 1. Python:使用關鍵短語從字符串中提取文本
- 2. 從文本中提取關鍵句子
- 3. 從文章中提取關鍵字
- 4. 使用彈性搜索從文本中提取關鍵字(多字)
- 5. 如何提取文本中使用的關鍵字?
- 6. 從文本中提取所需的關鍵字
- 7. Rails - 從文本塊中提取seo關鍵字
- 8. 在C#中使用SQL關鍵字MySqlCommand.CommandText
- 9. 使用2個關鍵字從json文本中提取正確的ID?
- 10. 如何使用PHP從孟加拉文本中提取關鍵字
- 11. 從網頁中提取Meta關鍵字?
- 12. 從Excel或Google電子表格列中提取關鍵字
- 13. 使用TF-IDF提取關鍵字
- 14. 使用nlt庫提取關鍵字
- 15. 如何使用DBPedia從內容中提取標籤/關鍵字?
- 16. 從列表中提取關鍵字,然後使用`和`
- 17. 用Poppler(C++)從PDF中提取文本
- 18. 從基於關鍵字的固定長度的文本中提取字符串
- 19. 提取關鍵字/從字符串變量使用Preg_match_all
- 20. 提取相關標籤/從文本塊關鍵詞
- 21. 在提取的文本中搜索關鍵字javascript
- 22. JSON從關鍵字提取值
- 23. LINQ可以用來從字符串中提取關鍵字嗎?
- 24. 關於c#關鍵字中未提及的上下文關鍵字
- 25. 從PDF文檔中提取文本 - C#
- 26. 機器學習:從文件列表中提取關鍵字
- 27. 從維基百科文章中提取Java關鍵字
- 28. 正則表達式從推文中提取關鍵字
- 29. 如何從文本中提取關係
- 30. SQL腳本從自由文本字段中提取國家
誰決定哪些關鍵字?這是一些預定義的列表嗎? – 2011-02-13 15:37:27