2012-04-04 50 views
0

我用nutch爬過很多網站。我使用Solr 3.4來瀏覽結果,但我想按其域名對結果進行分組。例如,如果我搜索「tabnak」,第一個結果只包含「http://tabnak.ir」,並不顯示該域的其他結果(如谷歌)。如何在solr中按域分組結果?

我想忽略結果,如:

http://tabnak.ir/en/news/1020/title 
http://tabnak.ir/fa/allnews 
... 

如何創建與組,group.field和Solr查詢......?

感謝

+0

你是什麼意思? – hadi 2012-04-04 20:45:11

+0

據我所知,SOLR不知道域名。這只是一個字符串。此外,我認爲這個問題還沒有很好解釋,請再磨光一下 – 2012-04-09 23:36:20

回答

0

你應該創建一個單獨的索引字段(例如命名在這種情況下,「域」),並應確保你從一個網址的域時SOLR索引數據。

然後,您必須將字段合併分組應用到搜索結果中。參見:http://wiki.apache.org/solr/FieldCollapsing