2010-10-11 71 views
2

有沒有辦法檢查mysql中的多個短語?MySQL查詢檢查某些短語(重複的文章,抄襲)

我需要檢查一篇文章是否有存儲在mysql中的重複版本。

這是算法 我首先創建句子的排列是檢查(刪除所有非字母數字字符) 然後生成查詢(如何?) 後,我得到的結果我比較,如果50需要%的句子是重複的,比我認爲文章是重複的。 表中的文章以刪除的非字母數字字符存儲。 例如:

iamdevelopingatooltocheckduplicatearticlesstoredinmysqldatabasehoweveriveencountered 

有什麼建議嗎?

回答

1

是的,看看「編程集體智慧」瞭解這些算法。他們與分組有關。