2013-05-09 49 views
1

我希望能夠以編程方式(不顯示在瀏覽器中顯示)發送一個URL,如http://www.amazon.com/s/ref=nb_sb_noss_1?url=search-alias%3Daps&field-keywords=platypi&sprefix=platypi%2Caps&rh=i%3Aaps%2Ck%3Aplatypi「並返回一個字符串(或一些更合適的數據類型?)頁面的html結果(有趣的部分,無論如何),以便我可以解析並重新格式化它的選定部分作爲匹配的文本和圖像(鏈接到相應的頁面)我想用Razor/Web Pages做到這一點,如果這有什麼不同的話如何檢索並解析從URL返回的HTML?

IOW ,這是一個屏幕抓取的問題,但真的是一個「幕後」的刮擦。

這是可能的嗎?如何?100分後答案獎金將獎勵給(或最有幫助)回答。

回答

3

使用WebClient類(或.NET 4.5的更好HttpClient類)下載HTML,然後使用HTML AgilityPack解析它

+0

我不會真的嘗試一下本作有點,但它有「的環真相「,所以我會盡快通過這樣的標準來識別這一點。我認爲有很多教程很容易獲得關於如何使用HttpClient(我也看到在HTML AgilityPack網站也有)。 – 2013-05-09 20:57:18