2012-02-09 90 views
0

我想創建一個文件檢查器與我的程序的自動更新程序。文件檢查與自動更新

這個想法是,用戶只是爲我的程序下載啓動程序,然後啓動程序將下載本地用戶指定的幾個設置所有必需的文件。並且它還將檢查文件是否爲: 1)最新版本, 2)損壞, 3)未找到, 4)需要更新。 2,3,4會導致文件檢查器將文件添加到To_Download列表中,而如果它是1,文件檢查器會將其標記爲有效並繼續前進。

要做到這一點,我想寫一個校驗和函數,檢查所有文件,並將哈希與已知健康散列(我使用非託管SHA1)進行比較。但是,如果我然後從服務器下載該文件的新實例,則校驗和會完全不同,儘管我知道這些文件完全相同,除了不同的修改/創建時間。

我需要一個快速可靠的文件檢查,但不容易旁路。以及讓我確信用戶計算機上的文件與服務器上的文件相同。

我使用Sha1的原因是,我認爲它具有較少的「碰撞」,碰撞對於md5替代品而言更加「昂貴」。目前使用

using (FileStream fs = new FileStream(FilePath, FileMode.Open, FileAccess.Read)) 
using (BinaryReader file = new BinaryReader(fs)) 
{ 
    SHA1CryptoServiceProvider unmanaged = new SHA1CryptoServiceProvider(); 
    byte[] retVal = unmanaged.ComputeHash(file.ReadBytes(Convert.ToInt32(fs.Length))); 
    file.Close(); 

    StringBuilder stringBuilder = new StringBuilder(); 
    if (retVal != null) 
    { 
     foreach (byte b in retVal) 
     { 
      stringBuilder.Append(HexStringTable[b]); 
     } 
    } 
} 

和hexstringtable

private static readonly string[] HexStringTable = new string[] 
    { 
     "00", "01", "02", "03", "04", "05", "06", "07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F", 
     "10", "11", "12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C", "1D", "1E", "1F", 
     "20", "21", "22", "23", "24", "25", "26", "27", "28", "29", "2A", "2B", "2C", "2D", "2E", "2F", 
     "30", "31", "32", "33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D", "3E", "3F", 
     "40", "41", "42", "43", "44", "45", "46", "47", "48", "49", "4A", "4B", "4C", "4D", "4E", "4F", 
     "50", "51", "52", "53", "54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E", "5F", 
     "60", "61", "62", "63", "64", "65", "66", "67", "68", "69", "6A", "6B", "6C", "6D", "6E", "6F", 
     "70", "71", "72", "73", "74", "75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F", 
     "80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A", "8B", "8C", "8D", "8E", "8F", 
     "90", "91", "92", "93", "94", "95", "96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F", 
     "A0", "A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB", "AC", "AD", "AE", "AF", 
     "B0", "B1", "B2", "B3", "B4", "B5", "B6", "B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF", 
     "C0", "C1", "C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC", "CD", "CE", "CF", 
     "D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7", "D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF", 
     "E0", "E1", "E2", "E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED", "EE", "EF", 
     "F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8", "F9", "FA", "FB", "FC", "FD", "FE", "FF" 
    }; 

任何想法,這是爲什麼下載新的文件有不同的哈希比預期的(因爲它是相同的?)

編輯

我覺得愚蠢的做法是不比較一個hexeditor中的兩個文件。看起來問題是這些文件中有一個丟失的字節,現在我已經解決了這個問題。目前需要60-70秒才能檢查所有7000個文件,有沒有可能進一步提高速度?

+0

你是最有可能的IO在這一點上的約束 - 只有這樣,才能加快會僅在輸入文件的某些部分創建散列,而這又不能保證找到更改。除此之外,您可以擺脫'StringBuilder'並直接比較字節。 – BrokenGlass 2012-02-09 19:21:58

回答

1

您是否嘗試過比較這些文件以查看發生了什麼變化?如果SHA1不同,則文件是不同的(modtime與此無關)。嘗試對它們進行比較或在十六進制編輯器中比較它們以查看不同之處。

+0

我這樣做了,似乎由於某種原因該文件有1個丟失的字節。我現在解決了。 – Raskaroth 2012-02-09 19:14:00

1

您的邏輯似乎是正確的,並且會產生應匹配相同文件的哈希碼字符串。然而,你可以做到這一點更短,無需查找表(或保留那部分只有性能原因):

public string CreateFileHash(string filePath) 
{ 
    using (FileStream fs = new FileStream(filePath, FileMode.Open, FileAccess.Read)) 
    { 
     SHA1CryptoServiceProvider unmanaged = new SHA1CryptoServiceProvider(); 
     byte[] retVal = unmanaged.ComputeHash(fs); 
     return string.Join("", retVal.Select(x=> x.ToString("x2"))); 
    } 
} 
+0

我使用查找表的唯一原因是性能方面的原因 – Raskaroth 2012-02-09 19:13:13

+0

您的原始算法適用於我的幾個測試文件 - 您確定下載在您運行時已完成嗎?由於某種原因,下載器沒有在每個文件中寫入最後一個字節,因此請致電 – BrokenGlass 2012-02-09 19:16:33

+0

。我已經解決了這個問題。算法的性能如何? – Raskaroth 2012-02-09 19:18:12