2010-03-11 41 views
0

我正在嘗試將全文搜索功能添加到我的RoR應用程序,但在涉及到阿拉伯語時遇到一些問題。 AFAIK,那裏沒有很多搜索引擎支持阿拉伯詞幹,詞法和其他高級全文搜索。我唯一發現的是帶有AraMorph標記器的Lucene。RoR中的阿拉伯文全文搜索

acts_as_solr插件(solr基於lucene,這個插件將它與Rails集成)似乎被放棄了,而且我找不到任何有用的文檔。

我已經看過獅身人面像,xapian,雪貂,和acts_as_searchable,但他們都沒有提供高級阿拉伯文搜索功能,據我所知。

任何幫助將非常感激

==更新
我有建議使用獅身人面像,而我卻用它在早期的一個項目,它工作得很好。但是,它不提供任何高級搜索功能。
例如,詞語:كتاب(書),مكتبة(圖書館)和كاتب(作家)都來源於相同的詞幹كتب。我想有能力搜索「作家」,並獲得從同一詞幹衍生的所有單詞的結果。
另外,我想讓搜索考慮到常見的阿拉伯語聽寫風格。有些人使用「hamza」(همزة),有些人則沒有。其他人用字母「taa marboota」(التاءالمربوط)寫字,而其他人用字母「haa」(الهاء)寫字。一個好的阿拉伯語搜索引擎應該意識到這些微妙的差異並尋找它們。

隨着獅身人面像,你只能得到你所尋找的東西,而我發現的唯一引擎,以阿拉伯文的語言來容納這些問題,是帶有AraMorph標記器的Lucene。但是,acts_as_solr(用於rails的lucene插件)被放棄。所以我的問題是:任何搜索引擎是否還有其他此類標記器?
KandadaBoggu提到的黑子,我給一個去,並進行迴應

回答

1

你應該通過擴展思維獅身人面像選擇

閱讀本試試這個:http://www.expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode

+0

Thanx爲鏈接。我早些時候遇到過,並且設法讓獅身人面像在阿拉伯語網站上運行。請檢查我的問題的更新,以更好地解釋我的問題。 – Faisal 2010-03-11 10:25:33

+0

我會接受這個答案,因爲它提供阿拉伯文搜索和字符摺疊。但是,干擾並沒有解決。 – Faisal 2010-04-21 09:24:16

1

對於Solr的使用SunspotSunspot Rails

對於獅身人面像使用Thinking Sphinx

兩種寶石是優秀的,有一個大的安裝基礎。我在很少的項目中使用了ThinkingSphinx,我高度推薦它。

+0

我用獅身人面像+ ThinkingSphinx用阿拉伯語。工作正常。 – uzzz 2010-03-11 09:13:02

+0

獅身人面像是偉大的,用它在一個項目之前在阿拉伯文和它的作品。但是,它不提供任何高級的完整搜索功能。它只搜索我給它的任何東西,沒有詞幹,形態或考慮到阿拉伯語變音符號。 我會給太陽黑子去,並報告返回 – Faisal 2010-03-11 09:58:28

+0

太陽黑子軌道似乎是一個非常堅實的搜索引擎。但是,我確實設法使它與AraMorph(阿拉伯語詞幹分析師)合作。 Thanx爲反饋提示 – Faisal 2010-03-24 09:38:50