2016-08-17 87 views
2

我使用Kettle編寫了ETL過程。它執行從操作數據源(Windows上的MS SQL)到數據倉庫(Ubuntu上的MySQL)的數據傳輸。Schedule Kettle作業

enter image description here

我想安排日常執行工作水壺(其他),用於填充維度表和事實表的表,有我的實際數據並準備分析和報告。

我該如何計劃執行水壺工作?

我將非常感激這些信息。謝謝大家。

回答

3

在你的水壺安裝目錄下有幾個批處理文件,其中spoon.bat,pan.batkitchen.batSpoon是您已知的UI,pan是從命令行運行轉換(.ktr文件)的命令行工具,kitchen是運行水壺作業(.kjb文件)的命令行工具。

對於一個簡單的計劃創建一個批處理文件,調用kitchen.bat或pan.bat(取決於您是否要運行轉換或作業)。然後使用Windows任務計劃程序以您想要的時間表運行您的批處理文件。

例如,這將運行一個水壺的工作,使用基本日誌和日誌內容附加到一個日誌文件

kitchen.bat /file:"c:\etl\my_first_job.kjb" /level:Basic > c:\etl\logs\logging_for_my_first_job.log 

這當然是對的窗戶。如果您在linux上運行水壺,則可以在水壺安裝目錄(pan.shkitchen.sh)中使用cron和相應的.sh文件。

由於kettle會在用戶配置文件中存儲共享數據庫連接,請確保運行計劃任務的用戶在其配置文件中包含這些連接,否則您的轉換將失敗。

+0

非常感謝您的快速解答! –

+0

正是我在找的東西......第一個......謝謝! – cbmeeks

2

pentaho中的調度是由carte服務器完成的。 http://wiki.pentaho.com/display/EAI/Carte+User+Documentation

使用你的開始步驟params調度和carte服務器,你將能夠安排這個水壺工作,當你想要的。

+0

非常感謝您的回答!這很有趣,我會閱讀,謝謝。 –

+1

歡迎您,一旦您的carte服務器啓動,您將能夠通過carte遠程服務器中的水壺執行操作,並從START步驟參數中進行調度(在開始步驟中指定計劃作業) – jipipayo