2012-09-10 305 views
0

問題:我們的cassandra數據庫佔用大量磁盤空間。估計的數據大小約爲10Gb,而佔用的磁盤空間大約爲100Gb。我們做了很多寫/刪除操作。我們有兩個節點。cassandra磁盤空間使用情況

下面是我們試圖做的(按順序有人做過):

  1. 運行壓實兩個節點上 - 完成,但零效果
  2. 設置gc_grace 0
  3. 運行維修上兩個節點 - 一個節點成功,另一個修復「掛斷」 - 它還活着,但持續了3天,之後我們將其切斷。
  4. 在兩個節點上運行壓實 - 已完成但仍爲零。

有人可以幫忙嗎?我們接下來應該做什麼? :)

+1

您正在使用哪個版本的casssandra?你如何將數據加載到cassandra?你在做多少刪除操作?你有沒有嘗試從cassandra刪除數據後運行壓縮兩次,零gc_grace? – samarth

+0

- 我們使用cassandra v1.1.2 - 我們使用像這樣的hector客戶端(請參閱下面的答案) - 我們的平均大小爲2MB的約200次/分鐘和200次刪除/分鐘的二進制文檔 - 我們沒有刪除與gc_grace = 0。我們先刪除它們,然後將gc_grace設置爲0,運行修復(2個節點中的1個成功)並運行壓縮。 – shutyaev

回答

0

我面臨與Cassandra 2.0.9類似的問題。

我成功地通過在每個節點上使用nodetool clearsnapshot來清除HDD上的空間。可以僅刪除指定列族的快照。有關nodetool實用程序使用情況的詳細信息,請參見here