2016-02-12 78 views
0

Folk,給定色譜柱系列的SSTtable編號

我們試圖評估CASSANDRA作爲生產應用之一。我們很少有基本的疑問,我們希望在繼續之前瞭解。

寫:

卡桑德拉使用一致性哈希機制跨節點均勻分佈的關鍵。因此,某些Cassandra節點上將提供一些密鑰。

我們進一步瞭解,將會創建內部SSTTable結構來存儲節點中的這些數據。

READ:

在執行一個讀客戶端將發送請求到任何卡桑德拉節點羣集和基於一致散列卡桑德拉將確定的鍵位於哪個節點上。

以下情況不明確。

1)有多少SSTTables對於給定的密鑰空間/列族創建的節點上(是它的一些固定數或僅1)

2)卡桑德拉文檔描述,有一些掃帚濾波器(替代標準哈希),用於確定給定密鑰是否存在於SSTtable中(如果有1000個SST表,將會有1000個布隆過濾器將被檢查以確定密鑰是否存在)

回答

0

1)穩定數量取決於壓實策略和負載。要想一個想法檢查出log structured merge trees有一個基本的理解,然後看看不同的壓實策略(大小分層,水平,日期分層)。

2)是的,每個sstable有一個bloom過濾器給出該sstable中存在的分區的概率成員資格。布隆過濾器的大小取決於分區數量和目標誤報百分比。他們不在堆中,而且一般都很小,現在比以前的版本更少關注現在的問題。

檢出發電機和大表格文件可能有助於理解集羣和存儲背後的原理。讀/寫路徑上有很多免費資源,並且在堆棧溢出問題中完全過多,所以我建議通過datastax academy或某些YouTube上的演示文稿的某些材料。