4
我有一個HTML文件,它在語法上不正確,我用HTML Agility Pack解析它。使用C#,如何檢測斷開的鏈接或標記?
但是,如果我有一個像
<a href="http://google.com/!/!!!">Google</a>
鏈接這是一個問題,是有可能的方式,這樣,當發現錯誤檢測損壞的鏈接(無頁是可用的鏈接)的應用程序會將該鏈接存儲在列表中並返回它?在標籤上
同樣的問題,例如:
<img hhh="jjj"/>
這裏的圖像標籤是完全錯誤的,這應該是在「錯誤的修復名單了。
在此先感謝。
我已經做到了:)但問題是我怎麼才能發現鏈接是不好的或不是... – 2010-10-05 12:18:46
您可以使用WebClient類來請求URL並查看是否有異常。 – SLaks 2010-10-05 12:19:14
嗯,這很好,但對於img標籤,例如?或身體標籤等,有沒有一種通用的方法來修復它們? – 2010-10-05 12:21:01