2014-11-22 141 views
0

我們期待爲6TB的數據創建索引。索引大小約爲10 GB。 1)那麼需要多少碎片? 2)由於硬件限制,我正在考慮只使用1個Solr機器和一些碎片。我有16GB RAM和4核心機器。Solr中的碎片數量

請讓我知道你在這方面的經驗。

回答

1

如果您的索引大小不超過10GB,並且所有碎片都將位於同一臺服務器上,那麼目前沒有太多理由需要考慮分片。這可能不會給你任何方式。如果您計劃在稍後添加更多服務器,那麼您可以在當時分發索引 - 當您知道您將擁有哪種資源時。你可能想在這種情況下查看SolrCloud - 透明地處理副本和分片。

現在,如果在單個服務器上,您可以使用單個服務器,並在需要時爲第二臺服務器執行復制以獲得更大的查詢負載。

重新編制索引數據的過程比建立一切方式的索引更重要。

+0

請糾正我,如果我錯了....因爲我使用單機,那麼我應該使用複製到同一個盒子內的其他solr實例。在這種情況下需要多少實例來複制保存索引的大小?另外,使用分片時可以執行復制嗎? – 2014-11-24 07:36:45

+0

複製將複製單個碎片到另一個實例,所以這不是問題。如果您打算進行分片_and_複製,您可能需要從頭開始進行SolrCloud。 – MatsLindh 2014-11-24 08:10:52

0

一如既往,它取決於您將要運行的查詢和數據。我建議花一點時間和測試各種配置,看哪一個能提供最好的價值。

需要考慮的一件事是您可能需要HA,因爲需要這樣的第二臺服務器,但這一切都取決於您的要求。

我有四個10 GB的碎片運行在一個盒子上,32 GB分配給JVM,它們表現良好。他們也與SolrCloud鏡像到另一個實例(所以查詢之間分佈)。我們通常每天獲得大約25萬個查詢,並且每個查詢都使用了很多方面和一些功能。

希望它有幫助。

+0

感謝您的數字,當您鏡像到另一個實例,那麼這些鏡像實例是在同一個盒子或不同的盒子?您的應用程序中的總索引大小以及您使用的存儲驅動器有多少? – 2014-11-24 07:44:35

+0

複製副本位於HA的不同框中。總索引大小爲45GB,查詢日爲20萬條。不確定在驅動器上,但大部分索引都在linux內存緩存中 – user2630270 2014-11-25 20:16:47