我有一個日誌文件,其中包含搜索查詢輸入到我的網站的搜索引擎。我想將相關的搜索查詢「分組」在一起以獲得報告。我爲我的大多數web應用程序使用Python - 所以解決方案可以是基於Python的,或者如果使用SQL更容易執行此操作,則可以將字符串加載到Postgres中。分組相關搜索關鍵字
示例數據:
dog food
good dog trainer
cat food
veterinarian
組應包括:
貓:
cat food
狗:
dog food
good dog trainer
食品:
dog food
cat food
等等
想法?某種「索引算法」也許?
我不知道我明白。你能否解釋你打算如何決定哪些詞是相關的?或者是這個問題? – 2010-02-16 20:07:35