2014-10-01 61 views
0

我有一個快速增長的數據庫,我使用Elastic Search來管理它。它只有一個索引並且每天獲得200 K個新文檔。每個文檔包含約5 KB的文本。
我是否應該只使用一個索引,或者最好每天有一個索引或其他東西? 如果是這樣,有多個指數有什麼好處?我應該在彈性搜索中控制索引大小嗎?

回答

1

你絕對應該擔心你的碎片/索引的最大尺寸。我們使用每日索引來填充每天插入數百萬條記錄的數據和每月插入數百萬條數據的月度索引。

一個好的經驗法則是,碎片最多應該在4 GB左右(記住每個索引有一個可配置的碎片數量)。

優點是,當您有每日/每週/每月的索引時,最終可以在集羣變得太大或數據不再有用時關閉/刪除它們。如果您的數據是時間序列數據,那麼您可以制定查詢以僅查找用於給定數據的索引。另外,如果您在真正需要多少碎片時犯了錯​​誤,您可以更正它(因爲您會定期創建一個新索引)。

缺點是你必須管理所有額外的索引,但有些工具可以做到這一點(例如elasticsearch-curator)。