2017-08-25 85 views
0

一個給數學家。測試一個立方體 - 每個維度的切片又是否足夠?

說我有兩個立方體或維度建模的數據集A和B.

爲了證明他們是相同的,是它足以通過依次每個維度切片他們每個人,並確認彙總每個成員都是一樣的?

一個簡單的例子:尺寸國家(英格蘭和蘇格蘭),性別(男性和女性)和已婚(是或否)。衡量CountPeople。

如果我切片按國家CountPeople,從比較A和B的結果,然後按性別,然後結婚,並找到相同的結果,我已證明,在A和B的每一個細胞都相同?

認爲我有,但我不知道。

回答

1

不,反過來每個維度切片不足以證明立方體是在細胞水平上是相同的。它可能會在大部分時間足夠接近,但它沒有數學保證。

我們可以用一個相當簡單的例子來證明這一點,只是性別和國家維度。試想一下,我們在細胞水平以下數據:

  • (男,英格蘭):100,(女,蘇格蘭):100

如果我們按性別或國家分別切片,我們得到:

  • 男:100,女:100
  • 英格蘭:100,蘇格蘭:100

現在,如果所有的男性移動到蘇格蘭和所有的女性搬到英國,我們將不得不在小區層面上不同的數據:

  • (男,蘇格蘭):100,(女,英格蘭):100

但是,無論是單維報告的數據將是相同的:

  • 男:100,女:100
  • 英格蘭:100,蘇格蘭:100

這是一個相當平凡的例子,但對於非平凡數據存在相同的可能性,所以爲了100%確定兩個立方體是相同的,您需要在單元級別驗證。

+0

謝謝!你的例子說得很清楚。 「沒有數學保證」就是我的問題。 – SebTHU