2010-11-22 64 views
0

我有一個標籤表與一個巨大的數據。我需要創建一個自動完成的文本框,並像stackoverflow一樣搜索類似的標籤。我試過mysql LIKE但它很慢。我正在尋求一種方法來優化這項任務。優化「搜索類似的標籤名稱進程」

回答

1

您可以查看全文索引LuceneSphinx。另外,因爲你只是在標籤上做這些事情,你將不得不使用一些n gram tokenizer。

通常情況下,您會在長內容或至少幾個句子值上創建索引。大多數標記器使用空格和標點符號來分隔單詞,在你的情況下,例如分隔每3個字符會更好。因此,例如,如果你在你有

主機託管 託管

和用戶輸入的主機,發動機會搜索居屋+ T和發現具有這種組合兩種東西。