2012-07-26 76 views
1

我想創建多個域的自定義搜索引擎。
如何使用solr與nutch創建500多個域的自定義搜索,同時搜索每個域應該能夠顯示自己的數據。nutch和solr多域

例如
example.com exapmle2.com example3.com等等,當用戶在example.com上搜索時,他應該得到屬於example.com的數據,同樣適用於example2.com等等

這些網站可能是博客郵政,電子商務網站,分類網站或酒店預訂網站。

任何建議,將不勝感激。

+0

當你說域名是什麼意思,網站名稱像stackoverflow.com或網站類型像消費電子產品? – Umar 2012-07-26 14:57:35

+0

一般來說,您可以使用不同的Solr核心,但是瞭解更多關於這些域名的信息會更好。例如。它們有多大(你期望有多少文檔?平均文檔大小?信息域的類型將被存儲?域模式之間的差異?任何你能想到的 - 告訴我們......)。它可能會變成你只需要單核心與不同的實體,或不同的訪問權限... – 2012-07-26 22:54:57

+0

@umar我的意思是像example.com subdomain like sub.example.com – 2012-07-29 09:26:16

回答

1

這應該是可能的開箱即用。當你使用nutch模式索引solr時,它有一個名爲site的字段來存儲域。在您選擇域名(又名站點)的搜索界面(即您將構建的)上,您只需傳遞一個過濾器查詢(如「site:domain」),以便結果僅限於搜索的域。

注意:如果要限制對注入域的爬網,請確保將外部鏈接屬性設置爲nutch爲false。

希望能回答你的問題。