這是一個出現在Python編碼競賽中的問題,並且想知道如何實現這一點。使用Python查找重複文件
問題陳述:
你(在它可能子目錄)有兩個目錄。 FAIL:如果ATLEAST一個文件名相同的內容不同
PASS:否則
,這裏是你的腳本應該由兩個根目錄
結果比較相同的文件名的內容找出重複的文件樣本圖
/dir1 /dir2
-- file1 -- file1
-- file2 -- fileA
-- file3 -- fileB
-- ....
-- ...
---/subDir1
--file1
--file2
file1 of dir1 contains :- foo bar
file1 of dir2 contains :- foo
Result - Fail
file1 of dir1 contains :- foo bar
file1 of dir2 contains :- foo bar
Result - Pass.
我試圖使用散列按文件大小,但它顯然不是辦法:)
PS:可以使用任何腳本語言。
感謝 凱利
我正要解釋一種方法,但我認爲最好只是將您推薦到完整的程序http://www.ssokolow.com/scripts/fastdupes.py(我沒有寫它,但我使用了一個修改它的版本),看着它會比我試圖解釋它是如何工作的更好。 – 2012-03-01 05:09:57