2012-08-02 106 views
0

我刮yahoo搜索結果,但我得到502 => Net::HTTPBadGateway。究竟是什麼導致錯誤?這是否意味着yahoo檢測到我的機器人並禁止我的IP?以編程方式搜索雅虎

+0

當您在瀏覽器中提出請求時,您會看到什麼?爲什麼雅虎? – pguardiario 2012-08-02 08:51:11

+0

最好從Google開始 – emaillenin 2012-08-02 10:01:10

回答

0

打印Response對象到控制檯(我建議awesome_print此),

但其....完全常規的搜索引擎到分組形狀,油門或塊履帶。我不知道如果雅虎這樣做,但谷歌肯定做

你可以考慮http://commoncrawl.org代替

0

是的,他們是阻止您的機器人,所有的大搜索引擎有防禦,以防止結果頁刮。不過,Google和Bing都提供了一個免費的搜索API,您可以使用它來提供您的機器人。