2016-05-10 67 views
0

我從單個表中提取了1.5TB數據庫。它被分成7個文件並用RAR壓縮。使用awk處理rar文件

我想字段的一個子集提取到另一個文件進行處理。

的例子我發現過程的bZIP或gzip的文件。我在問什麼可能?如果不是直接如何將文件轉換爲可以與awk一起工作的格式?

我有Centos6工作空間〜146GB。

+1

這是一個專有格式,首先你需要你的操作系統上運行的提取軟件。 'awk'對文本文件起作用。 – karakfa

回答

0

您可以嘗試使用unrar,然後將結果輸送至awk

例如:讓我們假設你需要的最後一個字段:

unrar p *.rar | awk '{print $NF}' 

或更有效地:

find . -name *.rar | xargs -n 1 -P 4 unrar p | awk '{print $NF}' 

的選項P是指 「打印文件到標準輸出」。

我希望這可以幫助你。