2015-11-02 37 views
1

我讀過在多個地方在於哈希單調遞增rowkeys有助於防止區域hotspotting通過分發數據散列RowKeys Vs的單調遞增RowKeys

https://stackoverflow.com/a/17969852/4495849

http://hbase.apache.org/book.html#rowkey.design

我擔心的是,這將增加太多的尋找,擊敗了hdfs的好處。有沒有一種情況下保持rowkeys不哈希會產生更好的性能。分配更好的好處是否超過尋找時間的增加?我的rowkey是timestamp和id的組合。每個ID約有20,000個ID和525600個(每分鐘讀數)。請求在很多小時間或大時間範圍內針對小型和大型ID進行製作

回答

1

有些時候,不帶鍵的鍵可以帶來好處。 當您需要閱讀某些範圍內的重要部分數據時從'xxx'到'zzz'的所有字符串。在這種情況下,不用鍵會給你帶來相當大的好處。您可以使用掃描開始和索行鍵。 HBase將只讀取這些數據。在散列鍵的情況下,您將需要掃描孔表並根據此範圍標準過濾值。