我今天早些時候提出一個問題,當我在Stackoverflow中遇到令人驚訝的功能時。當我寫了我的問題標題stackoverflow建議我幾個相關的問題,我發現已經有兩個類似的問題。那太棒了!如何實現「相關」度度量算法?
然後我開始思考如何實現這樣的功能。我怎麼會爲了通過關聯的問題:
- 問題有較多的 話與新的問題
- 配襯如果配襯的數量是 相同,詞的順序被認爲是
- 詞在標題中出現 更高的相關性
這將是一個簡單的工作流程或複雜的分數algortithm?有些可能會增加召回率? 有沒有一些庫實現這個功能? 你會考慮哪些其他方面?也許傑夫可以回答自己!你是如何在Stackoverflow中實現的? :)