2010-01-14 63 views
-1

我希望能夠將二進制文件X與其他二進制文件的目錄進行比較,並查找哪個其他文件與X最相似。數據的性質就是這樣文件之間會存在相同的塊,但可能會移位。這些文件都是1MB大小,其中大約有200個。我希望能夠快速地在現代臺式計算機上幾分鐘或更短時間內分析這些內容。 我google了一下,發現了一些不同的二進制diff實用程序,但它們都不適合我的應用程序。用於查找最匹配的二進制文件的實用程序或庫

例如,有bsdiff,它看起來像創建一些針對大小進行了優化的補丁文件。或者vbindiff以圖形方式顯示差異,但這些似乎並不能幫助我確定一個文件是否比另一個文件更類似於X.

如果沒有可以直接用於此目的的工具,有沒有一個好的庫可以推薦用於編寫我自己的工具? Python會更好,但我很靈活。

回答

相關問題