2011-06-03 58 views
1

我們在我們的Solr搜索中發現了詞幹,我們需要在詞幹後檢索詞/詞組。那就是如果我搜索「橙子」,通過阻止搜索「橙子」被執行。如果我打開debugQuery,我將能夠看到這一點,但是如果可能的話,我們希望通過結果訪問它。基本上,我們需要這樣做,因爲我們將搜索到的單詞作爲參數傳遞給第三方應用程序,該應用程序會在在線PDF閱讀器中突出顯示單詞。目前,如果用戶搜索「桔子」並且文檔包含「桔子」,那麼PDF將不突出顯示任何內容,因爲它試圖突出顯示「橘子」而不是「橙色」。返回Solr中的詞幹

感謝所有提前,

Krt_Malta

+0

如何訪問solr?如果您使用solrj java庫,那麼您可以按照本頁底部所述顯然訪問突出顯示:http://wiki.apache.org/solr/Solrj#Reading_Data_from_Solr – davek 2011-06-03 08:31:33

+0

我們使用基於SolrJ的API,因此可能是有用的。 highlightSnippets實際返回的是什麼? – 2011-06-03 08:39:23

+1

在solr管理員窗體中嘗試一下:... solr/icom/admin/form.jsp。將突出顯示設置爲啓用並選擇您的字段:該響應包含一組您可以解析的「突出顯示」元素。 – davek 2011-06-03 08:53:10

回答

0

我和Solr的沒有經驗,但如果你需要它只是呈現給用戶,你可以使用相同的詞幹Solr的使用自己幹自己的疑問。這可能會更快,因爲它會避免Solr的索引之旅。對於英文來說,這可能是http://tartarus.org/~martin/PorterStemmer/ - 或者你可以檢查Solr的實現。

但是,一個謹慎的詞,大多數詞幹算法並不能保證詞幹將是真正的單詞。例如,請查看http://snowball.tartarus.org/algorithms/english/stemmer.html