2011-04-14 37 views
0

我讀過一個臨時表應該是dw中目標表的列匹配的確切列。如果是這種情況,在填充登臺表後最好不要做後續的查找,以便將鍵與維表中的鍵匹配起來?應該在數據進入臨時表之前處理維表鍵查找嗎?

我的問題我猜是這樣的,應該在數據進入臨時表之前處理維表鍵查找嗎?

+0

我問的原因是,如果我延遲查找,直到登臺表填充完畢後,我可以避免從不同來源提取時進行重複查找。成本是我的登臺表不會與目標表完全匹配,並且會有拉取信息的列,這些列在插入之前將被丟棄 – bep 2011-04-14 04:53:28

回答

2

最好的做法是填充暫存數據,但這並不意味着您無法添加其他元數據列。只要分段數據完全可追溯到源未轉換,您可以添加任何代理鍵或其他ETL特定的數據,例如提取時間作爲示例,如果您願意的話。

數據倉庫中的正常實踐是按原樣填充登臺數據(摘錄),然後在插入SCD時查找維度鍵。登臺資料不應包含特定於倉庫的信息,因爲它可用於多種用途。

0

我很想知道你在哪裏閱讀。沒有硬性規定,但大多數臨時表都是所需源數據的原始轉儲,有時會執行一些基本清理。在這一點上,我會避免對數據倉庫進行任何查找。將數據從分段傳輸到倉庫時,查找過程應發生在該過程中。

相關問題