我可以用什麼來實現以下內容:腳本瀏覽器或以其他方式向服務器發送請求,登錄,瀏覽網站,例如。找到鏈接並導航到這些鏈接。腳本瀏覽器scapper
現在,因爲我進入了NodeJS,所以我在查看node.io.它允許你很容易地刮網站,但問題是當我嘗試發佈(登錄),我什麼都沒有回來!
nodeio = require "node.io"
nodeio.scrape ->
@post "http://localhost/auth/login", {
username: "username"
password: "password"
}, ->
console.log "=====After Login====="
但我只是得到
OK: Job complete
即使登錄失敗,我應該去登錄console.log
後?
然後我想也許它更好地通過腳本編寫瀏覽器來實現它,它會模擬更真實的請求?
我試過Zombie.JS路由,似乎沒有在一些網站上工作(不受我控制),可能他們檢測到它可能是一個機器人連接或什麼的,並拒絕連接。所以我們要走的是Selenium的路線,雖然運作良好,但速度慢一些,因爲我喜歡的速度太慢,但我想我可以讓它繼續運行。我認爲緩慢的原因在於,每次我執行「get(url)」時,它都會等待整個頁面,包括任何廣告或腳本在繼續之前進行渲染? – jm2 2012-07-23 01:21:02
我知道Watir等待整個頁面加載(不是腳本)。我聽說Selenium沒有,但他們可能已經改變了這一點。 – 2012-07-23 12:43:09