我正在使用Talend來填充數據倉庫。我的工作是將客戶數據寫入維度表並將事務數據寫入事實表。事實表上的代理鍵(p_key)是自動遞增的。當我插入新客戶時,我需要我的事實表來反映相關客戶的ID。ETL操作 - 返回主鍵
正如我所提到的,我的p_key是auto auto_incrementing,所以我不能只爲p_key插入任意值。
有關如何將行插入我的維度表並仍檢索要在我的事實記錄中引用的主鍵的想法?
更多信息:
如果傳入的數據未規範化會怎麼樣?比如我有一個具有以下數據爲csv:
order # date total customer# first_name last_name
111 1/2/2010 500 101 John Smith
222 1/3/2010 600 101 John Smith
很顯然,我希望客戶信息出現在維表和事實表的交易數據:
dimension
101 john smith
fact
111 1/3/2010
222 1/3/2010
正如你提到,維表的關鍵是自動遞增。事實表需要引用這個鍵。您如何設計etl作業,以便插入後返回代理鍵?
此外,如果客戶數據被刪除(如上),您將如何處理密鑰?
什麼是您的倉庫使用的RDBMS? –