2011-02-03 184 views
5

我想爲使用Django編寫的網站實施搜索解決方案。從可用的選項(我研究過Solr,Sphinx,Xapian,PostgreSQL/Tsearch3,MySQL)Sphinx看起來最好。但是,它不支持爲波蘭語進行遏制,而這是我想要搜索的數據的語言。波蘭搜索獅身人面像?

在Sphinx中處理不支持的語言的最佳方式是什麼?我有一個直覺,我可以從Ispell字典中創建一個詞幹語料庫。我如何能夠與獅身人面像一起工作?

回答

0

搜索http://snowball.tartarus.org/郵遞員,你可能會發現一些信息,如果有人試圖創建一個波蘭詞幹。有2個免費的stemmers可用,但它們是用java製作的(我認爲至少有一個是爲solr/lucene製作的)。從Ispell,我不確定這個詞幹語料庫是否可以幫助您,您可以創建文件以用於字形或其他語言。