mechanize-ruby

2熱度

1回答

紅寶石 - Socks4代理與WWW :: Mechanize和NET :: HTTP :: GET

我在谷歌搜索和閱讀紅寶石手冊，但我找不到一種方式來使用WWW :: Mechanize和NET :: HTTP :: GET通過socks4代理。我看到，WWW :: Mechanize是UserAgent模塊的一個子類，因此 - > proxy（）方法可以工作。但手冊只談及http，ftp和gopher代理。任何想法如何支持socks4？以下是代碼片段： def get_request(ur

0熱度

1回答

用奇怪的https形式機械化RoR

我正在使用RoR試圖在我的大學中使用機械化搜索簡單表單。該代碼工作正常，搜索谷歌，但在結果中返回搜索表單？我很困惑。有什麼建議？謝謝！ ruby script/console require 'mechanize' agent = WWW::Mechanize.new agent.get("https://www.owens.edu/cgi-bin/class.pl/") agent.pa

1熱度

1回答

使用Mechanize rubygem處理javascript onchange事件

我一直在試圖編寫一個腳本來從我的大學網站獲取結果。有人建議我使用機械化，它確實看起來很有前途。爲了得到結果，必須先輸入卷號然後選擇會話。使用Mechanize模擬第一部分很容易，但第二部分我遇到問題，因爲它實際上是一個JavaScript onchange事件。我讀了JavaScript中的函數定義，這是我到目前爲止所提出的。 Mechanize不能處理onchange事件，並且當我手動傳遞

2熱度

2回答

語言Iconv :: IllegalSequence使用WWW時::機械化

我試圖做webscraping的一點點，但WWW：機械化寶石似乎並不喜歡編碼和崩潰。在302重定向POST請求的結果（其中機械化如下，到目前爲止好），並在結果頁似乎崩潰了。我搜索了很多，但到目前爲止沒有提出如何解決這個問題。你們有沒有想法？代碼： require 'rubygems' require 'mechanize' agent = WWW::Mechanize.new ag

3熱度

2回答

`sysread'：中斷的系統調用（Errno :: EINTR）當使用Ruby和mysql時

我在用機械化方式刮取一個站點並推送到一個mysql數據庫。我得到這些系統讀取錯誤很多，我不知道解決方案是什麼。我正在使用Ruby-mysql gem。

12熱度

1回答

追趕機械化404 =>網:: HTTPNotFound

我寫了簡單的函數，它處理擷取網址的： def tender_page_get url, agent sleep(rand(6)+2) begin return agent.get(url).parser rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNotFound EYE.debug "--w

3熱度

4回答

任何人都知道Ruby Mechanize的緩存插件？

我有一個基於Mechanize的Ruby腳本來抓取一個網站。我希望通過在本地緩存下載的HTML頁面來加速它，以使整個「調整輸出 - >運行 - >調整輸出」循環更快。我寧願不必爲此腳本在機器上安裝外部緩存。理想的解決方案將插件機械化並透明地緩存提取的頁面，圖像等。任何人都知道圖書館會這樣做嗎？或者達到相同結果的另一種方式（腳本第二次運行更快）？

0熱度

1回答

Firefox和Ruby之間的表單參數區別機械化

我想弄清楚機械化是否發送正確的帖子查詢。我想登錄論壇（請參閱html source, mechanize log在我的其他問題），但我只獲得登錄頁面。當尋找到它，我可以看到，火狐發出後與參數，如 auth_username=myusername&auth_password=mypassword&auth_login=Login但我的腳本發送 auth_username=radek&auth_pa

1熱度

2回答

如何爲Webrat設置「基本URL」，機械化

我想指定一個基本URL，因此我不必始終指定絕對URL。我如何指定機械化使用的基本URL？