我是ETL遷移的新手。我曾與Talend合作過,但尚未面臨將大型ETL項目從一個工具遷移到另一個工具(IBM Data Manager到Informatica PowerCenter或Informatica Developer)的任務。ETL工具遷移:並行運行的最佳實踐
我期待通用的指導方針將工作從一個工具遷移到另一個工具,當然也適用於我的具體情況。
我會更清楚:
數據庫來源和Targes將是相同的,我必須遷移是ETL部分本身。
該方法會像這個博客建議並行運行:
在我來說,我沒有遷移所有數據倉庫而不是隻有ETL如舊軟件將成爲一個遺留一個而新的來自另一個供應商(幸運的是他們都可以導出XML)。
我正在尋找並行運行的實踐方法,事實上,我已經建議將Sources和Targes表複製到原始數據庫模式中,但它並沒有向我尋求最佳方法(即使不是實際一個模式有許多表)。
DWH我當然有幾個DBS實例在Oracle中,有些在SQL Server中,一個是測試服務器和一個生產環境,還有一個是分段,存儲和數據集市區域。
從這個相關的問題及其答案中,我正在考慮複製每個項目的每個模式。
Staging in ETL: Best Practices
希望有guidlines引用,但我的具體情況是來自IBM數據管理器的Informatica的PowerCenter
這個問題不適合SO的Q&A格式。但這裏有一些一般性建議。創建一個目標數據庫的副本。使用新軟件重建ELT。運行舊的和新的。檢查他們產生完全相同的結果。然後再次檢查並再次檢查。儘可能平行運行。這增加了捕捉模糊/偶發錯誤的機率。遷移可能很快變得非常複雜。所以不要改變一切。升級,修復和新想法可以等待。如果遷移當天出現問題,請確保您可以回滾到舊解決方案。測試回滾。 –
@ destination-data我瞭解SO的Q&A格式,但我沒有看到我的問題不太適合,因爲我儘可能具體(我編輯它編寫涉及的ETL軟件)。我不是在徵求意見,我要求提供一份最佳實踐/經驗清單,用於這樣複雜的任務(從ETL遷移到另一個,不常見)。你的建議是合理的,這是我的第一個方法,當然不能在答案中寫出解決方案,但是肯定的是,如果有ETL高級工程師在那裏,他/她可以給我一個路線圖(但更具體的我已經考慮到了這個問題) –
如果我的問題不適合SO的問答,那麼我應該對這個鏈接和許多類似的問題保持一致。另一方面,你有什麼建議讓我的問題適合問答?謝謝 –