2011-12-22 59 views
0

我正在尋找一個c#函數,它將Url作爲參數並返回與該url相關的所有入站url。Web抓取和入站鏈接解壓

+0

我已更正您的問題,但將來您是否會花費一些努力來編寫和使用標點符號。這樣每個人都可以輕鬆理解你在問什麼! – Fischermaen 2011-12-22 12:27:03

+0

你在哪裏搜索?因爲谷歌已經準備好了一些例子,你有什麼發現,你不明白?有一部分是你閱讀這個頁面,一部分是你獲取上下文並處理它。 – Aristos 2011-12-22 12:39:02

回答

0

您可以「下載」的網頁使用WebClient類:

String url = "http://www.google.com"; 

WebClient client = new WebClient(); 
String source = client.DownloadString(url); 

然後,你需要搜索的所有URL。我很樂意爲你寫一個RegEx,如果你努力尋找你沒有的答案,顯然。

寫那些正則表達式的一個是相當困難的,因爲有這麼多不同的事情,你一定要配合:

  • 相對URL的
  • 絕對URL的
  • IP的
  • 你必須要考慮的base標籤
  • 僅限於特定標籤(a,img,link,),和和)

0

從你的描述,你想找到「入站」祝你好運?網址到一個網址。如果是這種情況,您需要連接到API以檢索該信息。我不認爲Google有一個,但我知道它們存在。