mechanize-ruby

    2熱度

    1回答

    我在谷歌搜索和閱讀紅寶石手冊,但我找不到一種方式來使用WWW :: Mechanize和NET :: HTTP :: GET通過socks4代理。 我看到,WWW :: Mechanize是UserAgent模塊的一個子類,因此 - > proxy()方法可以工作。但手冊只談及http,ftp和gopher代理。 任何想法如何支持socks4?以下是代碼片段: def get_request(ur

    0熱度

    1回答

    我正在使用RoR試圖在我的大學中使用機械化搜索簡單表單。該代碼工作正常,搜索谷歌,但在結果中返回搜索表單?我很困惑。有什麼建議?謝謝! ruby script/console require 'mechanize' agent = WWW::Mechanize.new agent.get("https://www.owens.edu/cgi-bin/class.pl/") agent.pa

    1熱度

    1回答

    我一直在試圖編寫一個腳本來從我的大學網站獲取結果。有人建議我使用機械化,它確實看起來很有前途。 爲了得到結果,必須先輸入卷號然後選擇會話。 使用Mechanize模擬第一部分很容易,但第二部分我遇到問題,因爲它實際上是一個JavaScript onchange事件。 我讀了JavaScript中的函數定義,這是我到目前爲止所提出的。 Mechanize不能處理onchange事件,並且當我手動傳遞

    2熱度

    2回答

    我試圖做webscraping的一點點,但WWW:機械化寶石似乎並不喜歡編碼和崩潰。 在302重定向POST請求的結果(其中機械化如下,到目前爲止好),並在結果頁似乎崩潰了。 我搜索了很多,但到目前爲止沒有提出如何解決這個問題。你們有沒有想法? 代碼: require 'rubygems' require 'mechanize' agent = WWW::Mechanize.new ag

    3熱度

    2回答

    我在用機械化方式刮取一個站點並推送到一個mysql數據庫。我得到這些系統讀取錯誤很多,我不知道解決方案是什麼。我正在使用Ruby-mysql gem。

    12熱度

    1回答

    我寫了簡單的函數,它處理擷取網址的: def tender_page_get url, agent sleep(rand(6)+2) begin return agent.get(url).parser rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNotFound EYE.debug "--w

    3熱度

    4回答

    我有一個基於Mechanize的Ruby腳本來抓取一個網站。我希望通過在本地緩存下載的HTML頁面來加速它,以使整個「調整輸出 - >運行 - >調整輸出」循環更快。我寧願不必爲此腳本在機器上安裝外部緩存。理想的解決方案將插件機械化並透明地緩存提取的頁面,圖像等。 任何人都知道圖書館會這樣做嗎?或者達到相同結果的另一種方式(腳本第二次運行更快)?

    0熱度

    1回答

    我想弄清楚機械化是否發送正確的帖子查詢。 我想登錄論壇(請參閱html source, mechanize log在我的其他問題),但我只獲得登錄頁面。當尋找到它,我可以看到,火狐發出後與參數,如 auth_username=myusername&auth_password=mypassword&auth_login=Login但我的腳本發送 auth_username=radek&auth_pa

    1熱度

    2回答

    我想指定一個基本URL,因此我不必始終指定絕對URL。我如何指定機械化使用的基本URL?