2010-02-05 82 views
1

我想編寫一個腳本來登錄網頁並與網頁交互,並且有點不知所措。我大概可以找出HTML解析,但我如何處理登錄部分?我打算使用bash,因爲這是我最瞭解的,但我願意接受任何其他建議。我只是尋找一些參考資料或鏈接來幫助我開始。我不確定密碼是存儲在cookie中還是存儲在cookie中,那麼我如何評估這種情況呢?登錄到網頁的腳本

感謝,

回答

4

看看一個cURL,這是在Linux/Unix環境一般可用,它可以讓你的腳本的網頁呼叫,包括POST參數(比如一用戶名和密碼),並允許您管理cookie存儲,以便隨後的調用(在網站中獲取不同頁面)可以使用同一個cookie(因此您的登錄將在呼叫中保持不變)。

1

搜索此網站爲screen scraping。它會變得毛茸茸的,因爲你需要處理cookie,javascript和隱藏字段(viewstate!)。通常您需要刮取登錄頁面以獲取隱藏字段,然後發佈到登錄頁面。好玩:d

2

我不喜歡的東西,在工作前一段時間,我曾在一個頁面登錄並一遍又一遍地張貼同樣的數據...

看看here。我用wget是因爲我沒有使用curl工作。

+0

wget當然也是一種選擇;我已經完成了這兩個。據我記得,我發現cookie處理更容易,但都工作得很好。 – 2010-02-06 00:22:10