我用seleniumRC打開一個url,那該如何保存這個網頁?如何實現它像urllib.urlretrieve做到這一點?但urllib無法在頁面中操作JavaScript。還有一個問題:是否可以保存整個頁面,就像我看到seleniumRC打開它時那樣?如何用seleniumRC保存網頁
回答
這聽起來像你混淆了兩個非常不同的圖書館。
該模塊提供了通過萬維網獲取數據的高級接口。尤其是,urlopen()函數與內置函數open()類似,但接受通用資源定位器(URL)而不是文件名。
您可以使用python的urllib庫從有效的URL中檢索原始標記。該庫不會調用頁面上的任何嵌入式JavaScript,因爲該庫從不嘗試解析或呈現任何內容。
硒的遠程控制(RC)是一個測試工具,它允許你使用任何支持JavaScript的主流瀏覽器的編寫,任何HTTP網站的任何編程語言的自動Web應用程序的UI測試。
Selenium RC用於自動化測試。通過javascript在Web瀏覽器中執行測試,但這是一個測試套件,您收到有關測試狀態的信息。 Selenium RC不提供任何功能來保存渲染頁面的圖像。
除非我誤解你的問題,你似乎在尋找一個圖書館,讓您檢索渲染HTML頁面(包括JavaScript DOM操作)的圖像。如果確實如此,我會建議調查PyWebShot,這似乎提供了完全的功能。您可以通過操作here查看它的屏幕截圖(以及其他一些相關信息)。
如果它不一定需要是一個Python庫,有許多的Web服務各地提供的截圖:
謝謝您的建議。我不想截圖,而是整個網頁的html(其中包含一些javascript,所以有些文本不會顯示,除非您碰到它)來進一步解析它。 – Herta 2010-08-11 10:17:07
- 1. 保存網頁
- 2. 用urllib保存網頁
- 3. 如何將網頁保存爲PDF?
- 4. 如何將網頁保存爲圖片
- 5. Rails:如何保存外部網頁
- 6. 保存網頁時未保存圖像!
- 7. 如何將網頁保存爲Qt WebKit作爲「另存爲完整網頁」
- 8. 在android中保存網頁
- 9. Schtask保存網頁輸出
- 10. 如何保護網頁
- 11. 使用vbscript讀取/保存網頁
- 12. 使用Python將網頁保存爲PDF?
- 13. 在java中檢測seleniumRC網頁上元素的最佳方法
- 14. 如何使用Python將網頁保存到* .url文件中
- 15. 如何使用wget保存網頁及其對象?
- 16. 如何使用PHP將網頁保存爲圖像文件?
- 17. 在網頁上保存文本(1000頁)
- 18. 如何使用$ .ajax()保存頁面
- 19. 如何使用github做網頁寄存
- 20. 如何網頁C#位圖對象保存到Server磁盤
- 21. 如何將網頁收集數據保存到數據庫
- 22. 如何保存網頁中的圖像R
- 23. 如何保存一個asp.net網頁,以PDF
- 24. 如何將網頁表單保存到MySQL數據庫中?
- 25. 如何通過多個網頁保存數據
- 26. 如何在保存網頁時銷燬會話值
- 27. 如何提取文本,保存並輸出到網頁?
- 28. 如何將網頁保存爲html代碼?
- 29. 如何從網頁保存本地廣告?
- 30. 如何在iPhone中本地保存網頁?
你有沒有試過selenium.getHtmlSource()? – 2010-08-12 15:40:12