2012-02-06 94 views
0

我對Solr很新,我正在評估它。我的任務是在一本書的語料庫中查找單詞,並在小範圍內將它們返回。到目前爲止,我將書籍存儲在按段落分割的數據庫中(我通過換行符對書籍進行切片),然後執行全文搜索並返回該行。在Apache Solr中搜索書籍

在Solr中,我需要做同樣的事情,還是可以添加整本書(採用.txt格式),並且每當找到匹配項時,都會返回類似於匹配的內容加上前100個單詞和後100個單詞類似的東西?謝謝

回答

3

突出顯示將做你的出價。 http://wiki.apache.org/solr/HighlightingParameters

以下是相關選項供您:

hl.snippets 

The maximum number of highlighted snippets to generate per field..... 

hl.fragsize 

The size, in characters, of the snippets (aka fragments) created by the highlighter..... 
The default value is "100". 

hl.mergeContiguous 

Collapse contiguous fragments into a single fragment.... 

對於你的描述,將其設置爲返回5(或任何人可以三立處理)從text場片段與hl.fl;每個片段的長度在單詞/短語周圍400個字符(我近似爲100個單詞)。

另請參閱hl.regex.slop用於構建短語周圍的片段和hl.simple.pre/hl.simple.post用於標記。