2009-07-27 53 views
0

我正在尋找一個http庫(用於c#程序),這將允許我從網上下載一些html文檔。我知道HttpWebRequest對象和.NET庫提供的其他選項,但是,我需要更完整的解決方案,它能夠處理不同的文檔編碼(有時編碼是在文檔本身而不是在Http中指定的頭)。完整的Http庫

謝謝。

回答

3

WCF Rest Starter Kit包含一個HttpClient類,它非常有用 - 它現在可用於.NET 3.5 SP1並且可以立即使用。由於它似乎被認爲是一個有用的類,它可能最終會出現在基類庫的.NET 4.0的將來版本中。

肯定也簽出tutorial screencast亞倫Skonnard特色HttpClient的,並從WCF其他東西休息入門套件,以及其他WCF休息入門套件資源:

http://msdn.microsoft.com/en-us/netframework/cc950529.aspx

馬克

+0

對於.NET 4.0而言,Downvoted並不是RTM,所以提問者可能無法在生產環境中使用幾個月。 – 2009-07-27 18:20:36

1

Webclient班級提供您需要的一切。要處理特殊的編碼情況,請將文檔作爲字節流下載,然後執行必要的操作。

0

sztomi是對的,Webclient類可能可以做你需要的。

如果您需要解析並與HTML工作,檢查出的HTML敏捷性包(http://www.codeplex.com/htmlagilitypack

「這是一個靈活的HTML解析器,建立一個讀/寫DOM和支持純XPath或XSLT(你實際上並不需要理解XPATH和XSLT來使用它,不用擔心......)它是一個.NET代碼庫,它允許你解析「離開網頁」的HTML文件,該解析器非常容忍「真實世界」格式錯誤的HTML。對象模型與提出System.Xml非常相似,但對於HTML文檔(或流)。「