0
我正在處理從網頁上抓取數據。我所做的是每天「點擊」一些頁面並記錄頁面內容,以便進一步提取。當然,有幾十頁和幾個月的點擊,所以都是自動化的。通常我使用Cookies和POST使用curl
,並且它工作得很好。但我現在有一些「智能」頁面,它們使用了一些javascript,會話,巫術等等,並且不允許被簡單地刮掉。我真的需要點擊一些按鈕才能得到我想要的。腳本瀏覽器活動 - 自動點擊
所以,我想自動化這些操作。你會推薦什麼解決方案(語言,插件,...)?我知道iMacros;有沒有其他可比的解決方案?或者它是獨一無二的? (我在Linux下工作,順便說一句)
感謝所有的建議
編輯
相關:
我不這麼認爲。有一些瀏覽器插件可以做到這一點,但實際上並不奏效,因爲它們記錄了鼠標的x,y位置。然後,如果頁面更改其CSS,你必須重新錄製你的腳本。 – Erpheus 2012-02-01 13:43:16
哎呀,我在你回覆後刪除了我的評論。但是,http://en.wikipedia.org/wiki/Watir#Recorders提到了一些記錄器 – 2012-02-01 13:48:10