0

在我的源文件中默認只有16列。如何忽略在pentaho作業中MS Excel輸入中的隱藏列?

  1. 在我的第一個文件中有4個隱藏列,位於sitename和 campaignname之間。
  2. 在其網站名稱和 CAMPAIGNNAME
  3. 像明智的我所有的文件列之間2分隱藏的列我的第二個文件中hideing不同不同 格式。 請參閱我附上的圖像。文件1 enter image description here ..文件2 enter image description here
  4. 那麼如何爲所有文件加載一個單一的pentaho作業。 你可以幫忙嗎?謝謝。
+0

你有多少桌子。如果您有兩個輸入Excel文件或每個格式不同的1000個文件,則響應將會非常不同。 – AlainD

+0

我每天收到超過100個不同格式的文件excel。 – Velu

+0

你有沒有辦法知道哪些列必須被刪除(除了它們被隱藏的事實)?例如,它們是空的或沒有名稱或名稱不在SiteName,CampaignName,PackageName中...... – AlainD

回答

0

少量文件: 你似乎只有兩個文件,最簡單的可能是吞下兩個Excel文件各自的格式,然後用一個Select values只保留相關的列和合並它們進行其餘的轉換。

PDI可以合併兩個(或更多)輸入流,但它需要輸入具有完全相同的元數據(相同的列,相同的名稱,相同的類型,...),這是通過一個Select value

enter image description here

大量文件:調用列A

如果你有大量的文件,你有沒有列名讀他們(即無頭), B,C,D ......然後過濾掉你不感興趣的coumns並更改元數據。

最後你可以使用Metadata Injection Step