2011-03-23 83 views
3

我需要從包含混合數據的單個csv文件加載2個數據庫表。我也想用外鍵關係維護父母子女關係。水壺將csv數據加載到多個表中

下面是示例輸入csv文件的,

<name>,<title>,<department>,<location> 
John,Developer,IT, Florida 
Mike,Designer,Sales,Nevada 
Chris,Designer,Sales,Nevada 

並在下面表2層的結構。員工表具有dept_id作爲外鍵。部門表將具有唯一的名稱(不重複)。根據上面的示例csv,它應該有2個條目(IT,銷售)。

DEPARTMENT 
------------- 
id 
name 
location 


EMPLOYEE 
--------- 
id 
name 
title 
dept_id 

我是一個完全新的使用電熱水壺和任何指針將不勝感激。

回答

1

這很簡單。你已經下載了勺子,開始它,但(創建轉換編輯)

  1. 創建一個文本文件輸入
  2. 複製一步地按部門從文本文件輸入數據到一個組,然後插入/更新步驟,讓您的DEPARTMENT表
  3. 複製從文本文件輸入到另一個數據插入/更新表的步驟來創建你的員工表

至於ID的,你可以讓數據庫生成的作爲自動編號字段,如果你喜歡 - 並做查找o無論獨特的要求是什麼。

我強烈建議下載該工具並進行遊戲 - 一旦開始就很容易。

+0

我下載了它,但並不確定要使用哪些小部件和選項。忘了提及,2個表中的id是由DB.v自動生成的序列。如何在插入時從Department表中抽取id以在Employee表中使用。如果簡單的截圖或水壺會有所幫助。 – 2011-03-24 23:38:43

+1

我知道這個評論現在已經很老了,但在pentaho中有一個「添加序列」步驟,您可以在插入表格之前使用它來從DB序列中檢索下一個ID,然後將其與輸入文件一起插入到兩個表格中數據。 – 2011-11-07 15:51:19