2010-02-19 186 views
0

我有一個抓取程序,它會抓取URL來解析HTML,並在我開始這個過程中遇到一個不尋常的錯誤。從網站的特定URL集使用時取HttpWebRequest和HTTPWebResponse我得到的錯誤HTTPWebREquest - 返回WebException-錯誤(404)找不到

**>遠程服務器返回錯誤:

(404) Not Found**

這是不尋常的,因爲它在粘貼時它的工作原理我的瀏覽器。任何想法讚賞。不知道是否需要發佈代碼,但如果是這樣,請告訴我。

回答

1

該網站可能會阻止您的用戶代理,或者它可能需要cookie。

+0

我試着改變useragents,這沒有奏效。如何從程序中啓用cookie? – vbNewbie 2010-02-19 22:46:28

+0

好吧要嘗試cookiecontainer類thingy – vbNewbie 2010-02-19 22:50:31

1

遠程服務器是否可以根據用戶代理服務於不同的頁面,並且它沒有與HttpWebRequest實例提供的User-Agent值相對應的頁面(默認情況下爲空)?只是一個想法,因爲你說瀏覽器訪問它的地址時可以找到頁面,而不是通過代碼。

+0

謝謝你的迴應......不知道你的意思是什麼,但我確實嘗試了切換使用者並且沒有工作。它總是得到第一個網址,然後我收到錯誤。該網站是否阻止了我;這很有趣,因爲我檢查了robot.txt – vbNewbie 2010-02-19 22:47:58