2012-03-17 78 views
1

我是來自Python背景的C#的新手。我很難弄明白這一點。在python我可以使用beautifulsoup做到這一點:從HtmlAgilityPack打印網頁源代碼

from bs4 import BeautifulSoup 
import requests 
r = requests.get('http://stackoverflow.com').content 
soup = BeautifulSoup(r).prettify 
print soup 

這得到stackoverflow.com的源內容,並打印到控制檯。 我無法弄清楚如何在C#中做到這一點。

 var webGet = new HtmlWeb(); 
     var document = webGet.Load("http://stackoverflow.com"); 
     Console.WriteLine(document); 

這不起作用,它只打印var文檔的類型。有誰知道如何做到這一點?這將不勝感激 - 我試圖通過轉換我的Python程序之一來學習C#,只是fyi。

+0

當使用HtmlAgilityPack,它真的* *有助於瞭解在.NET框架內置的XmlDocument類。他們有幾乎相同的API。 – Cameron 2012-03-17 14:58:05

回答

4

使用DocumentNodeOuterHtml屬性:

var webGet = new HtmlWeb(); 
var document = webGet.Load("http://stackoverflow.com"); 
Console.WriteLine(document.DocumentNode.OuterHtml);