我正在編寫一個程序,該程序將幫助我找出鏈接到我的競爭對手的網站。爲了做到這一點,我正在編寫一個解析HTML文件的程序,並將生成2個列表:內部鏈接和外部鏈接。如何使用.NET RegEx解析HTML文件並找到1.外部鏈接。 2.內部鏈接
我將使用內部鏈接來進一步抓取網站,而外部鏈接實際上是我正在尋找的。
如何使用.NET RegEx解析HTML文件並找到1.外部鏈接。 2.內部鏈接。
在此先感謝, Eytan Levit。
編輯:在回答這個問題 - 不 - 我不受正則表達式,我可以使用任何其他的想法。
你必然的正則表達式,或第三方DOM的解析庫可太習慣? – 2009-07-01 15:36:38