過濾文本文件的行

我有一個類似於Bash, grep between two lines with specified string的情況。我有以下格式的輸出的文本文件：過濾文本文件的行

HEADER A 
lines of output 
---------------- 
HEADER B 
lines of output 
---------------- 
...rinse and repeat...

我想匹配具有相同標頭的所有塊。 grep似乎不足以完成此任務。我只是模糊地熟悉awk和sed。足以認識到他們可能是這裏最合適的工具。那麼如何匹配一個由匹配的HEADER和----------行封閉的塊呢？

我的基於鏈接的問題，嘗試

awk '/HEADER/{f=1} /-/{f=0;print} f' filename.txt

然而，這仍然符合一些與第二集塊線。

來源

2017-07-16 Code-Apprentice

也許你需要擴大你的輸入文件，並告訴你如何得到錯誤的輸出...... –

@GeorgeVasiliou剛編輯顯示更清楚的文件格式。 –

爲什麼不'awk'/ HEADER A/{f = 1}/-------/{f = 0; print} f'file.txt' ...？ –

調整this answer，以適應問題，我得到：

sed -n '/HEADER/,/-/p' filename.txt

這是相當脆（它停止當它找到一個連字符），所以像

sed -n '/HEADER/,/^-+$/p' filename.txt

檢查全連字符可能更可取。據我所知（不是sed專家），斜線之間的所有內容都是正則正則表達式，啓用了多行標誌m。

來源

2017-07-16 18:28:00

我的一點研究表明''x，y''語法匹配從'x'到'y'的多行，可以用正則表達式來指定。據我所知，每個正則表達式只匹配個別行。 –

我已經遇到了你的第一個解決方案的脆弱性。帶有第二個標題的塊包含負數。 –

對於這樣一個文件：

$ cat file1 
HEADER A 
lines of output1.1 
---------------- 
HEADER B 
lines of output2.1 
---------------- 
HEADER A 
lines of output1.2 
---------------- 
HEADER B 
lines of output2.2 
---------------- 
HEADER A 
lines of output1.3 
---------------- 
HEADER B 
lines of output2.3 
----------------

像這樣的東西給所有頭一句臺詞：

$ awk '/HEADER A/{f=1} /-------/ && f==1{f=0;print} f' file1 
HEADER A 
lines of output1.1 
---------------- 
HEADER A 
lines of output1.2 
---------------- 
HEADER A 
lines of output1.3 
----------------

你只需要在終端線路

使一個AND條件（& &）

如果這不是你所需要的，恐怕你應該重新輸入你的問題，以便更清楚一點。

來源

2017-07-16 19:54:57

你能解釋一下，在你的命令結尾處'f'的功能是什麼？如果'f'是1，那麼打印記錄，這是否正確？ – FloHe

@FloHe在'awk'世界中，最後一個'f'是一個awk快捷方式，用於說明'if f == 1 then print'（或者在awk代碼中'f == 1 {print $ 0}'）。更確切地說，一個單一的f是一個條件檢查，相當於'如果f不是零或者f沒有被設置，那麼打印這條線'。此外，在awk中，我們可以在'condition {action}'的awk語法中省略'{action}'部分。完成該操作後，將執行默認操作=打印該行='{print $ 0}' –

好的答案，謝謝 – FloHe

過濾文本文件的行

回答

相關問題