0
我正在處理分割成目錄中多個文件的數據集。數據應該由一個給定的字符(在這種情況下爲分號)分隔,每行一次,但是在某些地方,文件的分隔符多於一行,這會導致分析問題。使用包含給定字符的多個實例的行來查找文件
手動搜索這些是不可行的,那麼我能用什麼終端命令來識別這些違規文件呢?
編輯:根據要求,一些例子:
下面的文件不會被報道,因爲它包含每行最多一個分號:
100238500378 : 1001, 0417, 8432-09
500145287532 : 5a43, 4371097, 9588
255908245-03 : 3570-3, 1507
雖然下面的文件將報告,因爲它包含多行中的一行:
100238500378 : 1001, 0417, 8432-09
500145287532 : 5a43, 4371097, 9588
23054589808 : 5430958, 234:44, 0476509
255908245-03 : 3570-3, 1507
請給應符合一些示例行,不應該匹配 –
@SharuzzamanAhmatRaslan添加的行。 – DTR
沒有一個「終端」。您使用什麼操作系統? – jwodder