0

我是ETL遷移的新手。我曾與Talend合作過,但尚未面臨將大型ETL項目從一個工具遷移到另一個工具(IBM Data Manager到Informatica PowerCenter或Informatica Developer)的任務。ETL工具遷移:並行運行的最佳實踐

我期待通用的指導方針將工作從一個工具遷移到另一個工具,當然也適用於我的具體情況。

我會更清楚:

數據庫來源和Targes將是相同的,我必須遷移是ETL部分本身。

該方法會像這個博客建議並行運行:

Parallel Run

在我來說,我沒有遷移所有數據倉庫而不是隻有ETL如舊軟件將成爲一個遺留一個而新的來自另一個供應商(幸運的是他們都可以導出XML)。

我正在尋找並行運行的實踐方法,事實上,我已經建議將Sources和Targes表複製到原始數據庫模式中,但它並沒有向我尋求最佳方法(即使不是實際一個模式有許多表)。

DWH我當然有幾個DBS實例在Oracle中,有些在SQL Server中,一個是測試服務器和一個生產環境,還有一個是分段,存儲和數據集市區域。

從這個相關的問題及其答案中,我正在考慮複製每個項目的每個模式。

Staging in ETL: Best Practices

希望有guidlines引用,但我的具體情況是來自IBM數據管理器的Informatica的PowerCenter

+0

這個問題不適合SO的Q&A格式。但這裏有一些一般性建議。創建一個目標數據庫的副本。使用新軟件重建ELT。運行舊的和新的。檢查他們產生完全相同的結果。然後再次檢查並再次檢查。儘可能平行運行。這增加了捕捉模糊/偶發錯誤的機率。遷移可能很快變得非常複雜。所以不要改變一切。升級,修復和新想法可以等待。如果遷移當天出現問題,請確保您可以回滾到舊解決方案。測試回滾。 –

+0

@ destination-data我瞭解SO的Q&A格式,但我沒有看到我的問題不太適合,因爲我儘可能具體(我編輯它編寫涉及的ETL軟件)。我不是在徵求意見,我要求提供一份最佳實踐/經驗清單,用於這樣複雜的任務(從ETL遷移到另一個,不常見)。你的建議是合理的,這是我的第一個方法,當然不能在答案中寫出解決方案,但是肯定的是,如果有ETL高級工程師在那裏,他/她可以給我一個路線圖(但更具體的我已經考慮到了這個問題) –

+0

如果我的問題不適合SO的問答,那麼我應該對這個鏈接和許多類似的問題保持一致。另一方面,你有什麼建議讓我的問題適合問答?謝謝 –

回答

1

的方法遷移取決於不同的標準和個人喜好。無論採用哪種方式,您都需要複製零件或所有源系統和目標系統。在極端情況下,您可以使用整個系統的兩個實例。如果您有複雜的上游流程作爲測試的一部分,或者您擁有大量的表和進程,並且您擁有複製系統的帶寬和資源,那麼這種方法可能是最佳的。另一個極端是,如果任何複雜的過程在ETL工具本身內發生,或者您只是簡單地加載表並需要檢查它們是否正確加載,那麼複製這些表並將新舊工具指向表格副本可能是要走的路。這種方法非常簡單,易於設置。

請記住,本論壇並不意味着取代關於這些技術的博客和深入的技術文章。

+0

我正在繼續採用第二種方法,所以一個較不復雜,因爲到目前爲止我的知識,項目不涉及複雜的ETL過程(並且可能與新的,Informatica不同),即使我簡化爲I可以管理從源中提取而不是在舊系統中同時作業,因此可以使用相同的源)。我正在採用這種方法,至少目前爲止我沒有不同的要求。 –