2017-05-05 73 views
0

我想了解一些關於HBase架構設計的建議。例如,有2000名患者,1名。每名患者都有姓名,性別,年齡,hospital_ID。 2.每位患者將記錄活動數據,例如每分鐘的心臟位數,位置和步數。 3.每位患者將接受幾份調查問卷。HBase架構設計示例

如何組織HBase表?

非常感謝您的幫助

我現在的想法是使用patient_ID作爲行鍵。每個病人在HBase表中只有一行。但是,所有的活動數據都將被分組在嵌套表格中。活動數據表將包含數百萬行。 所以,表格將有三列家族。 CF1:info,CF2:activity_data,CF3:問卷。

然後, CF1:信息包括(姓名,性別,年齡,ID)

CF2:activity_data(數據(嵌套表))

CF3:問卷(questionnaired_ID(嵌套表))

我不知道這是否是一種設計HBase架構的巧妙方法。 請給我一些建議。

非常感謝您

回答

0
  1. 當你設計數據模型,它是非常重要的是瞭解數據的使用,特別是其對存儲在數據查詢你想高效地運行(不包括全表掃描) HBase的。
  2. activity_data似乎是一個原始數據,但其他兩個部分與「病人檔案」相關。有一個recommendation可以在同一個表中保留或多或少相同大小的列族。那麼最好將activity_data保存在不同的表格中,然後聚合,讓我們說每日總結並將結果存儲在「患者個人資料」表格中。

我希望它有幫助。