我需要加載HTML和解析它,我認爲它應該是簡單的東西,我傳遞一個字符串與一個「HTML」它讀取Dom像對象中的字符串,所以我可以搜索和解析HTML的內容,促進刮擦和類似的東西。Html字符串閱讀器
你們知道這樣的事情嗎?
感謝
我需要加載HTML和解析它,我認爲它應該是簡單的東西,我傳遞一個字符串與一個「HTML」它讀取Dom像對象中的字符串,所以我可以搜索和解析HTML的內容,促進刮擦和類似的東西。Html字符串閱讀器
你們知道這樣的事情嗎?
感謝
類似的API來XmlDocument
,例如(從實例頁):
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
HtmlAttribute att = link["href"];
att.Value = FixLink(att);
}
doc.Save("file.htm");
(你也應該能夠使用LoadHtml
加載HTML的字符串,而不是從路徑)
你知道這是否是針對Silverlight庫編譯? – AnthonyWJones 2010-04-22 07:28:34
@安東尼 - 不知道,對不起。 – 2010-04-23 05:22:51
我無法在WCF中訪問這些東西。我必須做一行一行的解析。非常愚蠢和困難。 – Oakcool 2010-04-27 03:51:31
如果您在瀏覽器中運行,您應該能夠使用Html DOM橋接,將HTML加載到它中,然後走DOM樹。
謝謝你不要求一個正則表達式來做到這一點;-p – 2010-04-22 04:12:14