2016-11-24 32 views
2

我有一個字符串seule laprésentation獅身人面像 - 將utf8字符分解爲空格

當我做一個詞組搜索「公關」,獅身人面像這個字符串匹配,但它不應該因爲沒有字PR存在於它。

但是當搜索到「pre」時,它不匹配。

問題似乎與此utf8字符。 Sphinx忽略這個字符,同時索引和處理字符串作爲一個單詞。

下面是示例Sphinx查詢與匹配模式SPH_MATCH_EXTENDED

@name: "pr" 

對此有什麼解決辦法?

回答

1

不是這方面的專家,但是你必須明確地列出了被認爲是charactors的「話」(一切被認爲是分隔符)部分斯芬克斯知道,通過charset_table

http://sphinxsearch.com/docs/current/conf-charset-table.html

所以你會需要包括這些人物造型(收費)charset_table爲他們可轉位(有或無「摺疊」非方言字符)

這是一個wiki頁面 http://sphinxsearch.com/wiki/doku.php?id=charset_tables 該列表•我的東西,你可能能夠複製/粘貼。

+0

謝謝巴里!添加'charset_table'爲我工作。 – Samir