2015-05-19 99 views
1

如何規劃資源(我懷疑,elasticsearch實例):Logstash/Elasticsearch/Kibana資源規劃

隨着負載我的意思是≈500K事件/分鐘,每片含8-10場。

什麼是我應該轉動的配置旋鈕? 我是新來的這個堆棧。

+1

你要保存數據多久?你希望你有什麼樣的查詢負載?最後,它將取決於許多因素,所有你可以得到的是(可能受過教育的)猜測;你只需要自己嘗試一下。 –

+0

感謝您的評論。負載是永遠的,保留可以是2個月。存儲在這裏不是問題,查詢的能力是。查詢是針對儀表板的,1-2位用戶應該同時使用它,比方說每個儀表板有20-30個可視化對象。 我只想知道,它是一大堆服務器,還是<10? – inteloid

回答

4

每分鐘500,000個事件是每秒8,333個事件,對於一個小型集羣(3-5臺機器)來說,這應該很容易處理。

問題將隨着保持720M每日文檔打開60天(43B文檔)。如果10個字段中的每個字段都是32個字節,那麼磁盤空間爲13.8TB(單個副本接近28TB)。

爲了便於比較,我在最大(64GB RAM,31GB堆)上有5個節點,其中1.2B文件佔用1.2TB磁盤空間(雙倍帶副本)。這個集羣無法處理每臺機器只有32GB內存的負載,但現在用64GB很高興。這是我們10天的數據。

粗略地說,您希望擁有比我的羣集消耗的磁盤空間大10倍的文檔數量的40倍。

我沒有確切的數字在我面前,但是我們的使用doc_values的試點項目給了我們像節省了90%的堆。

如果所有這些數學成立,並且doc_values是那麼好,那麼只要涉及索引的實際字節,就可以使用類似的集羣。我會徵求關於擁有這麼多單獨文件的開銷的額外信息。

我們已經做了一些彈性搜索調整,但可能還有很多工作要做。

我建議你從少數64GB機器開始。您可以根據需要添加更多內容。在一些(較小的)客戶端節點中作爲索引和搜索請求的前端。

+0

謝謝。我有很強大的64GB RAM機器,將重新考慮我的保留策略。 假設我有這一切,10臺機器處理30Tb的數據,彈性集羣能夠及時查詢,每個實例大約需要1.5Tb的掃描。 – inteloid