我有文件file1
和file2
,其中file2
是file1
的子集。這意味着,如果我遍歷file1
,也有一些線路是在file2
,有的都沒有,但在file2
沒有網上說是不是在file1
。文件中可能有幾行文本中具有相同的內容。現在我想知道它們之間的區別,即file1
的所有行不在file2
之間。沒有排序的兩個文件之間的差異
的diff(1)不是答案,COMM(1)是。
(無論出於何種原因)
但據我瞭解,爲comm
的文件需要先進行排序。問題:兩個文件都是有序的(不是排序!),並且這個順序需要保留。所以我真正想要的是遍歷file1
,並檢查每一行,如果它也在file2
。如果不是,請將其寫入file3
。如果同一內容出現多次,應該保留多次!
有沒有辦法用命令行來做到這一點?
看起來看第一行後良好。我無法確定地說(文件太長),但我認爲這是解決方案。謝謝! –
嗯好吧我只是比較行號。它應該是5213,但它是5211.不幸的是,非常小的差異,但並不完全正常工作。 –
請將file1和file2上傳到某處。 – Cyrus