2011-05-20 70 views
1

我正在做一個MySQL網站後端和獅身人面像作爲搜索引擎。說,我有一個設計師「雷朋」的項目,我需要得到它,因爲當用戶鍵入「射線禁令」或「rayban」。是否應該有某個排除列表?我如何讓獅身人面像忽略一些人物?

回答

1

你最好的選擇可能是the exceptions file - 儘管這意味着你需要知道每個你想要兩個不同的單詞/短語對待相同的情況。

3

這樣做的標準方法是charset_table選項。 charset_table選項定義字符僅必須被標記化,

即與此charset_table選項

index YOUR_INDEX_NAME 
{ 
charset_table = 0..9, A..Z->a..z, _, a..z 

這樣的文本

My best fiend is Hoo-foo but not Pe_ter.!!! That's all. 

被解析爲這些令牌

my best friend is hoo foo but not pe_ter that s all 
1

作爲0.9版本.8每個名爲ignore_chars的索引都有一個排除列表選項。

例如。

獅身人面像網站上提供
index YOUR_INDEX { 
     charset_type = utf-8 
     ignore_chars = - 

的更多信息:http://sphinxsearch.com/docs/manual-0.9.8.html#conf-ignore-chars

旁註:他們顯示了使用U + AD以消除他們的榜樣軟連字符。由於某種原因,這對我不起作用,但我上面給出的例子工作得很好。