2012-03-06 131 views
2

我有一個從HTML文件中提取信息的C#模塊。但我的輸入是一個MHT文件。我該如何去解壓MHT文件的html部分?C#從MHT文件中提取HTML

+2

MHTML文件是_Mime HTML_文件。你需要一個Mime解析器/解碼器。 [相關問題](http://stackoverflow.com/questions/3876406/basic-c-sharp-mime-decoding) – 2012-03-06 20:38:44

+0

感謝您指出我在正確的方向! – 2012-03-14 21:36:10

回答

1

我試過幾個工具&據說這些庫允許我提取MHT的內容,但幾乎都失敗了(我發現MHT文件的提供者沒有正確地編碼某些類型)。我最終發現了Total Commander,它讓我解開MHT並提取html部分。這是一個黑客攻擊,但它完成了工作。

似乎有很多創建MHT的工具,很少有用於解包它們的工具。