從unix終端,我們可以使用diff file1 file2
來查找兩個文件之間的區別。是否有類似的命令來顯示2個文件的相似性?每個文件都包含一個字符串句子線(讓許多管道,如果必要如何查找2個不同文件中的重複行? Unix
;它們進行排序和複製與sort file1 | uniq
刪除線
file1
:。http://pastebin.com/taRcegVn
file2
:http://pastebin.com/2fXeMrHQ
而且輸出應輸出出現在兩個文件中的行。
output
:http://pastebin.com/FnjXFshs
我可以使用Python做它是這樣,但我認爲這是一個有點太投入了終端:
x = set([i.strip() for i in open('wn-rb.dic')])
y = set([i.strip() for i in open('wn-s.dic')])
z = x.intersection(y)
outfile = open('reverse-diff.out')
for i in z:
print>>outfile, i
做你的文件是什麼樣子? – paulmelnikow 2013-03-18 05:26:46
可能重複[如何顯示共同線(反向差異)?](http://stackoverflow.com/questions/746458/how-to-show-lines-in-common-reverse-diff) – tjameson 2013-03-18 05:26:47
大多數時間a一串人類語言句子。有時也列出更多信息。 – alvas 2013-03-18 05:37:15