2017-04-02 103 views
1

IMAP過濾和搜索規定我的腳本的工作原理如下:每晚我收到一封附有相關.doc文件的電子郵件。我的Python腳本總是選擇最近的(最近的)電子郵件,並對該文件執行某些操作。Python:檢查「兩個」.doc文件是否是相同的文件?

全部.doc每天發送的文件命名完全一樣。

問題是:有時寄件人會忽略發送新文件。結果是我的腳本在錯誤的文件(前一天的文件)上執行了操作。如果我能以某種方式檢查兩個文件實際上是同一文件的(副本),那麼我可以避免執行該操作。

在Python中這是如何最簡單/有效地實現的?

回答

1

比較文件的二進制明智的,最好的/最快的方式是使用filecmp模塊:

>>> import filecmp 
>>> filecmp.cmp("first.doc","second.doc",shallow=False) 

回報True如果這兩個文件共享完全相同的文件內容。 shallow設置爲False,因此無論日期有什麼差異(當您提取兩個文件時都會有這些差異),文件內容將被分析。

相關問題