1
我讀過在多個地方在於哈希單調遞增rowkeys有助於防止區域hotspotting通過分發數據散列RowKeys Vs的單調遞增RowKeys
https://stackoverflow.com/a/17969852/4495849
http://hbase.apache.org/book.html#rowkey.design
我擔心的是,這將增加太多的尋找,擊敗了hdfs的好處。有沒有一種情況下保持rowkeys不哈希會產生更好的性能。分配更好的好處是否超過尋找時間的增加?我的rowkey是timestamp和id的組合。每個ID約有20,000個ID和525600個(每分鐘讀數)。請求在很多小時間或大時間範圍內針對小型和大型ID進行製作