所以我有一個包含大量行的文本文件。每行是一個沒有間距的長字符串,但是,該行包含多條信息。該程序知道如何區分每行中的重要信息。該程序確定該行的前4個數字/字母與特定儀器一致。這是文本文件的一個小例子部分。查找部分匹配的行
例如文本文件
1002IPU3...
POIPIPU2...
1435IPU1...
1812IPU3...
BFTOIPD3...
1435IPD2...
正如你所看到的,也有包含1435這個文本文件,它與特定的儀器重合之內兩行。然而這些線不相同。如果有同一個電臺的重複(即有兩個1435 *電臺),我正在使用的節目無法進行計算。我需要找到一種方法來搜索我的文本文件,並確定是否存在代表文件中站點的部分字符串的任何重複項,以便我可以刪除一個或兩個重複項。如果我可以讓BASH腳本輸出包含重複項的行數以及重複行的內容,我們將不勝感激。我認爲可能有一個簡單的方法來做到這一點,但我一直無法找到任何這樣的例子。感謝您的幫助。
'sort -k1.1,1.4 file.txt | uniq -Dw4'爲你工作? – heemayl
所以我試着你的命令,我得到了'>> $ sort -k1.1,1.4 text.file | uniq -Dw4 \ uniq:非法選項 - D \ 用法:uniq [-c | -d | -u] [-i] [-f fields] [-s chars] [input [output]]'我做錯了什麼?只是好奇,如果你遇到這樣的事情... – Jon
對不起,我還是新來堆棧溢出,有時我的意見看起來很奇怪。當我使用「\」時,只是要注意那是一條新線。 – Jon