回答
這被稱爲更多類似這樣的功能。像Lucene這樣的庫支持這個功能。 Read here瞭解更多詳情。
最可能的是,你需要設計存儲關鍵字和搜索基於問題的標題相關項目的表。因此,一旦輸入了問題,每個關鍵字的計數器就會定義該問題與其他存儲問題的相關性,並且可以通過排名將最高命中次數顯示爲最低。這就是我的想法。希望我的想法有所幫助,盡我所能,所以可能不是最好的答案,但幫助它做出貢獻。 :)
一個天真的方法是查詢問題中的字符串爲常見的單詞。
例如大多數的此頁面上的相關問題做有字「查詢」或「算法」在他們的頭銜,儘管他們似乎談論SQL,學習開發等不同領域。
所以基本上你可以採取一個問題,分裂的問題串,消除停用詞,然後嘗試匹配其他問題標題儘可能多字越好。
一旦你有一組問題,在這裏已經在標題匹配單詞,由匹配或其它度量的數量訂貨它們(SO例如upvotes,答案或觀看次數)。
非常好,感謝您花時間寫出您的答案。 – Chaddeus 2011-02-07 08:51:42
我會處理這個問題是這樣的。首先,刪除所有膠水的話:「對,一個,一個,但是,如果傾斜,就可以了,所以,不是」等(可能是一個巨大的名單)...
我應該在這一點留待應主要是名詞和動詞。
集羣您的文章的東西,如K-均值聚類,對那些話。最後,針對您的羣集訓練貝葉斯分類器,當您獲得新帖子時,將其歸類爲您的羣集之一...最後,返回來自該羣集的其他問題....
爲什麼downvote? – diugalde 2016-10-14 06:43:27
- 1. 基本算法查詢
- 2. SignalR連接相關的基本查詢
- 3. 什麼是聯合相關子查詢?它與子查詢有什麼不同?
- 4. 什麼是文本挖掘的基本算法?
- 5. 什麼是基於規則的算法?
- 6. TSQL內存相關查詢
- 7. 尋找相關文章的最佳算法是什麼?
- 8. 爲什麼mysql決定這個子查詢是相關的?
- 9. 什麼是好的輪詢算法
- 10. 什麼是graql查詢獲取圖中的所有內容
- 11. IP地址查詢信息的基本來源是什麼?
- 12. 基於地理參數查詢的最佳方法是什麼
- 13. randperm基於什麼算法?
- 14. 展位算法的本質是什麼?
- 15. 在PHP中快速查詢相關內容的快速問題!
- 16. mysql的多表/多實體相關內容查詢
- 17. 什麼應該是MySQL查詢以下內容?
- 18. SQL腳本,有關相關子查詢
- 19. 構建文本內容網站的正確方法是什麼?
- 20. 什麼是算法
- 21. 有關字符串的基本查詢
- 22. 關於tkinter中bindtags的基本查詢
- 23. 關於cookies的基本查詢
- 24. MYSQL查詢相關查詢
- 25. 爲什麼我的不相關的子查詢很慢?
- 26. 錯誤與組由在相關子查詢內的查詢
- 27. Redshift相關子查詢內部錯誤
- 28. 是什麼 - 是指查詢
- 29. 無法使用相關的查詢
- 30. 查找基於文本內容
*「是否有標準化技術爲此?「 - - 號碼 – 2011-02-01 03:58:07