請幫我理解在HBase中存儲信息的最佳方式。 基本上,我有一個rowkey,如hashed_uid + date + session_id,其中包含持續時間,日期,時間,位置,深度等指標。 我讀了很多材料,我有點困惑。人建議少列家人有更好的表現,所以我面臨的三個選項中進行選擇:hbase設計concat長鍵值對vs多列
讓每個指標在一排坐在像
rowkey_key cf1->alias1:value
有很多列像
rowkey cf1->key1:val1, cf1->key2:val2 ...
將所有鍵值對編碼爲一個大字符串,如
rowkey cf1->"k1:v1,k2:v2,k3:v3..."
預先感謝您。我不知道該選哪個。我的HBase設計的目標是爲用戶分析輸出的增量窗口函數做準備,如過去60天的百分位數,參與度和統計摘要。很可能,我會爲此使用配置單元。
我首先會問你爲什麼要使用hbase。 – Andrew
@Andrew是的,我目前的進程是在HDFS中,而且容量太大,無法處理。其次,我只發現HBASE可用於更好的增量計算和快照。 – Tadelicious