我有一個文檔列表,我根據用戶在Apache SOLR上的查詢索引這些文檔。我想通過使用相關索引文檔中的關鍵字來提取一些新聞文章,並將其與索引文檔一起顯示給用戶。是否有任何算法或程序可以從文檔中提取相關關鍵字並將其用於提取新聞?從維基百科文章中提取Java關鍵字
0
A
回答
0
您應該研究TF-IDF關鍵字提取。大約兩年前,我使用英文Wiki和一個簡單的Python Script做了一個類似的過程。在繼續操作之前,您需要回答幾個問題。您可以使用TF-IDF關鍵詞提取here
- 你只關心單個關鍵字一個整潔的小書面記錄,否則將評估的短語,也和到什麼長度?
- 你會對傳入的數據進行任何自然語言處理,比如標記和詞幹?
- 您是否將關鍵字限制爲某些文章類型?某些類別的文章可以有他們自己的TF-IDF分數,所以你可能想要試驗你所需要的。
+0
我想要在用戶查詢中提供關鍵字和短語。但是這些應該是總結整個查詢的相關關鍵字,而不是其他停用詞或不相關的東西。是的,我將使用Apache SOLR處理這些查詢。 – SplinterCell 2014-11-26 21:19:47
相關問題
- 1. jsoup - 從維基百科文章中提取文本
- 2. 從維基百科文章(Python)中提取第一段
- 3. 從維基百科文章中提取數據
- 4. PHP +維基百科:從維基百科文章的第一段獲取內容?
- 5. 從維基百科中提取內容
- 6. 提取維基百科
- 7. 按主題搜索並從維基百科中提取關鍵字
- 8. 獲得維基百科文章概要
- 9. 總結維基百科文章
- 10. 隱藏維基百科文章反饋
- 11. 從Java中提取維基百科表中的特定元素
- 12. 從維基百科獲取文章XML轉儲 - 通過標題
- 13. 如何從維基百科獲取文章修訂歷史
- 14. 如何從當前維基百科文章中獲取相關主題?
- 15. 從維基百科取代文本
- 16. 從文章中提取關鍵字
- 17. 從文本中提取維基百科條目
- 18. 維基百科的文章頻率文章
- 19. 提取維基百科JSON密鑰php
- 20. 維基百科文章的第一句和Java
- 21. 什麼是用來當我讀到關於維基百科幾何/圖形文章,以創建維基百科
- 22. jsoup - 如何從維基百科文章的文本中獲取鏈接
- 23. 如何抓取維基百科文章的解析信息框?
- 24. 如何獲取所有維基百科文章標題?
- 25. 如何獲取維基百科文章的默認圖片?
- 26. 如何通過API獲取維基百科文章長度?
- 27. 獲取今日特色文章與維基百科API?
- 28. 從維基百科轉儲提取並行文本
- 29. 提取從維基百科的JSON文件
- 30. 維基百科:Java庫刪除維基百科文本標記刪除
你將什麼歸類爲「相關關鍵字」? – MatsLindh 2014-11-23 23:47:29
相關關鍵詞是指根據用戶查詢與用戶相關的關鍵詞。如果我將這個查詢命名爲「足球比賽」,那麼在這種情況下足球就是我的一個相關關鍵詞。 – SplinterCell 2014-11-25 01:01:08