取href's
和其他類型的可以嵌入URL的標籤。總之,從給定的網頁鏈接獲取所有URL's
。有很多取得URL's
的方法,即正則表達式,HtmlAgilityPack,Dcsoup等......我想知道哪一個最好?內部和外部鏈接
內部和外部鏈接
回答
您需要使用類似HtmlAgilityPack的內容來解析HTML文檔。您還需要使用XPath輕鬆解析HTML。
正則表達式也可以使用,但使用XPath更適合這項工作。
你可以給我一些使用HtmlAgilityPack的教程的鏈接因爲我什麼都沒發現。 – 2015-04-03 11:00:37
XPath的問題在於,HTML文檔可能無法正確格式化。這是XPath的要求之一。 – Fka 2015-04-03 11:34:48
@MAdeelKhalid http://www.4guysfromrolla.com/articles/011211-1.aspx – JunaidKirkire 2015-04-03 12:17:29
關於HtmlAgilityPack,這裏是他們的示例代碼示例:
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
HtmlAttribute att = link["href"];
att.Value = FixLink(att);
}
doc.Save("file.htm");
它吸引有href
屬性的所有<a>
元素。本示例從文件加載文檔,但當然可以從字符串加載文檔。
- 1. 內部和外部反向鏈接
- 2. 內聯函數和外部鏈接
- 3. App Store和外部鏈接
- 4. 內部和外部鏈接之間的差異
- 5. 內部和外部的鏈接列表元素不工作
- 6. HTML頁面上的內部和外部鏈接是什麼?
- 7. Jscrollpane和內部錨鏈接
- 8. 混合SQL內部和外部連接
- 9. JSF外部鏈接
- 10. Joomla外部鏈接
- 11. 複製變量內外部鏈接
- 12. Laravel內部鏈接
- 13. Webview內部鏈接
- 14. 內部和外部碎片
- 15. 外部鏈接永久鏈接
- 16. JavaScript:window.open外部鏈接和自動登錄
- 17. 全屏API和外部鏈接
- 18. qmake運行外部腳本和鏈接
- 19. jQuery UI選項卡和外部鏈接
- 20. 圖片外部的鏈接
- 21. Iframe外部的鏈接
- 22. Cordova 6.0外部鏈接
- 23. Flash Carousel的外部鏈接
- 24. 外部CSS鏈接問題
- 25. 外部鏈接不開放
- 26. Eclipse鏈接到外部類
- 27. 從SharePoint外部鏈接JSLink
- 28. PHP呼出/外部鏈接
- 29. 鏈接到外部主頁
- 30. CMAKE鏈接外部c庫
HTML無法使用正則表達式進行分析。使用HTML解析器,如[HtmlAgilityPack](https://htmlagilitypack.codeplex.com/) – 2015-04-03 10:43:40
不確定是否「不能」是合適的詞Panagiotis,但我會同意「不應該」。有很多更好的選項可用,比如你建議使用 – Sparky 2015-04-03 10:43:57
的Regex *可以用來分析HTML,但它就像試圖用大錘在牆上釘一個釘子 – Claies 2015-04-03 10:50:16