2016-11-17 83 views
0

我一直在尋找這個問題了一會兒回答:數據倉庫中最常見的粒度設計

當問粒度,考慮到眼前的例子是:交易中,日,周,月等我不能」找到任何其他類型的示例。例如,我們可以考慮「城市」,「國家」等粒度嗎?例如,當我們考慮一家全國性公司的銷售情況時?換句話說,粒度總是這種類型的時間?

回答

0

不,粒度並不總是與時間有關。您的最低粒度通常會是某種交易。 Kimball使用的一個例子來自零售環境:與產品銷售相關的最低粒度可能是在退房時正在掃描的物品。兩個這樣的交易可能同時發生,所以這不是一個基於時間的粒度。

幾乎任何可能是表的粒度,但金博爾建議工作,以最低的粒度,因爲這是更爲靈活的 - 那麼你可以切片,多渠道細分您的數據。你可能會選擇一些彙總的表格,你可以將數據彙總到星期級別,州級別,或者其他任何東西(可能出於性能原因,或者爲了讓某些用戶更容易) - 但這些不太可能是最低的粒度。

以State爲例 - 您可能在相同的層次結構中具有較低級別的信息,您可以使用縣,市,郵政編碼等分析銷售數據。您也可能擁有單個客戶的數據,特定的訂單參考,涉及哪個商店或銷售辦事處,哪些員工參與了處理訂單等等。因此,選擇使用狀態作爲事實表,除非你有一些特定的理由從基於訂單項目的事務處理事實表中彙總。

如果您經常看到日期或時間字段,因爲表格的粒度處於週期性快照事實中,但這些字段通常還會從其他較低粒度的數據源聚集起來。