2012-02-01 126 views
0

我正在處理從網頁上抓取數據。我所做的是每天「點擊」一些頁面並記錄頁面內容,以便進一步提取。當然,有幾十頁和幾個月的點擊,所以都是自動化的。通常我使用Cookies和POST使用curl,並且它工作得很好。但我現在有一些「智能」頁面,它們使用了一些javascript,會話,巫術等等,並且不允許被簡單地刮掉。我真的需要點擊一些按鈕才能得到我想要的。腳本瀏覽器活動 - 自動點擊

所以,我想自動化這些操作。你會推薦什麼解決方案(語言,插件,...)?我知道iMacros;有沒有其他可比的解決方案?或者它是獨一無二的? (我在Linux下工作,順便說一句)

感謝所有的建議

編輯

相關:

回答

1

我會建議你用紅寶石使用Watir。它非常易於使用,跨平臺和跨瀏覽器。當然它有一個非常好的文檔。

紅寶石可以在這裏下載:http://www.ruby-lang.org或在你的情況下,我會建議apt-get。

而且這裏的Watir:http://watir.com/但其easyer安裝使用

gem install watir 

不要忘了安裝和更新RubyGems的。

+0

我不這麼認爲。有一些瀏覽器插件可以做到這一點,但實際上並不奏效,因爲它們記錄了鼠標的x,y位置。然後,如果頁面更改其CSS,你必須重新錄製你的腳本。 – Erpheus 2012-02-01 13:43:16

+0

哎呀,我在你回覆後刪除了我的評論。但是,http://en.wikipedia.org/wiki/Watir#Recorders提到了一些記錄器 – 2012-02-01 13:48:10