0

對具有6維的數據倉庫進行建模。其中一個維度是客戶端,大約有60萬行,還有一些其他賬戶和產品。我通過乘以每個維度表的基數來估計事實表的行數,給出1 * 10^12行作爲結果。我的問題是,如果客戶不具有某種產品,是否會有該產品的一排(在事實表中具有cero值),還是不會成爲一排?我需要這些信息來知道我的aproximation將成爲行數的上限,還是確切的行數。是否應在事實表中使用所有尺寸值?

+1

可能不是。如果事實表記錄單個銷售額(例如),並且客戶沒有購買特定物料,則不會銷售,因此事實表中沒有行。這實際上是有幫助的,因爲它可以很容易地回答諸如「哪些客戶購買產品X而不是產品Y?」,「哪些客戶在銷售區域Z沒有購買產品A?」等問題。等 – Pondlife 2013-05-14 12:53:29

+0

謝謝!非常有幫助的答案 – 2013-05-14 15:14:47

回答

1

您不需要每個維度組合的條目。

通常事實表(或立方體)與理論尺寸(即尺寸基數的乘積)相比將非常小。即使相對少量的維度(例如,時間,產品,地理位置,客戶,銷售額等),這個理論上的行數(或單元)也可能非常大。這被稱爲立方體的稀疏性; OLAP引擎(例如,icCube,SSAS等)通常用於有效處理這種稀疏性。

+0

謝謝!正是我需要的。 – 2013-05-14 15:13:49