2010-04-22 131 views
4

我需要加載HTML和解析它,我認爲它應該是簡單的東西,我傳遞一個字符串與一個「HTML」它讀取Dom像對象中的字符串,所以我可以搜索和解析HTML的內容,促進刮擦和類似的東西。Html字符串閱讀器

你們知道這樣的事情嗎?

感謝

+2

謝謝你不要求一個正則表達式來做到這一點;-p – 2010-04-22 04:12:14

回答

13

HTML Agility Pack

類似的API來XmlDocument,例如(從實例頁):

HtmlDocument doc = new HtmlDocument(); 
doc.Load("file.htm"); 
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"]) 
{ 
    HtmlAttribute att = link["href"]; 
    att.Value = FixLink(att); 
} 
doc.Save("file.htm"); 

(你也應該能夠使用LoadHtml加載HTML的字符串,而不是從路徑)

+0

你知道這是否是針對Silverlight庫編譯? – AnthonyWJones 2010-04-22 07:28:34

+0

@安東尼 - 不知道,對不起。 – 2010-04-23 05:22:51

+0

我無法在WCF中訪問這些東西。我必須做一行一行的解析。非常愚蠢和困難。 – Oakcool 2010-04-27 03:51:31

2

如果您在瀏覽器中運行,您應該能夠使用Html DOM橋接,將HTML加載到它中,然後走DOM樹。