我正在運行一個命令,該命令爲特定日期的每個小時返回96 .txt
文件。所以最後它給了我一天24 * 96個文件在一個目錄中。 我的目標是提取四個月的數據,這將導致目錄中的30 * 24 * 96 * 4個文件。如何使用Perl從目錄中的所有文件中提取模式?
當我得到數據後,我需要從每個文件中提取某些「模式」並將其顯示爲輸出。
1)下面的腳本只有一天,其中日期是在腳本中硬編碼 2)我需要它在一個月內的所有天工作,我需要從六月運行至十月 3)數據是巨大的,我的磁盤將用完空間,所以我不想創建這些許多文件,而是我只是想動態grep,只獲得一個輸出文件。
我該如何有效地做到這一點?
我的shell腳本,看起來像這樣
for R1 in {0..9}; do
for S1 in {0..95}; do
echo $R1 $S1
curl -H "Accept-Encoding: gzip" "http://someservice.com/getValue?Count=96&data=$S1&fields=hitType,QueryString,pathInfo" | zcat > 20101008-mydata-$R1-$S1.txt
done
done
- 這將返回我需要的文件。
- 之後,我從每個文件grep「test/link/link2」*中提取一個URL模式。 grep的種類> 1.輸出
的是您的最終目標,只是從每個網址獲取一些文字?如果是這樣,你可以使用perl來獲取html,得到你想要的,然後扔掉剩下的東西。 – 2010-10-08 11:19:55
讓我看看,如果我有這個正確的:你在那裏*創建文件的shell腳本?然後你在你的本地文件系統上有它們,你需要處理它們 – Axeman 2010-10-08 13:13:25
因此,這聽起來像你正在做你所需要的。問題是什麼? – 2010-10-08 18:35:07