我不知道如何找到這些信息,到目前爲止,我已經找到了一些有關在Python中使用selenium的教程,但沒有太多關於這方面的內容。我能夠通過python運行一些基本的測試腳本,硒,但它只是顯示瀏覽器窗口幾秒鐘,然後關閉它..我需要將瀏覽器輸出到一個字符串/變量(理想情況下)或至少將其保存到一個文件,以便Python可以做其他事情(解析,等等)..我會很感激,如果任何人都可以指向我如何做到這一點的資源。由於Selenium with Python,如何在運行腳本之後獲取頁面輸出?
回答
有一種在Java中的Selenium.getHtmlSource()
方法,最有可能它也可以在Python中使用。它返回當前頁面作爲字符串的來源,所以你可以做任何你想要它
是的,我發現這個信息的硒rc python文檔,我忘了看那裏,因爲我一直在看一些其他硒API,我認爲是過時的或一些因爲它似乎沒有一個這樣的方法,但簡單的答案是看看在selenium rc文檔下的語言=),它的命令是這樣的:ret = sel.get_string(「getBodyText」 ,[]) – Rick 2010-08-26 21:01:20
好了,這裏是我是如何結束這樣做,任何人誰在將來需要這個..
你必須使用Firefox瀏覽器這個工作。
1)創建一個新的Firefox配置文件(不是必要的,但理想的,以便從正常的Firefox使用分離),有很多關於如何在谷歌上做到這一點,這取決於你的操作系統如何做到這一點
2)獲取firefox插件:https://addons.mozilla.org/en-US/firefox/addon/2704/(這會自動保存給定域名的所有頁面),您需要對其進行配置以保存您要自動保存的域名。
3)然後就啓動硒服務器使用您創建的配置文件(下面是Linux下的一個例子)
cd /root/Downloads/selenium-remote-control-1.0.3/selenium-server-1.0.3
java -jar selenium-server.jar -firefoxProfileTemplate /path_to_your_firefox_profile/
這就是它,它就會立即保存對於一個給定的域名,只要硒的所有網頁訪問他們,硒也創建了一堆垃圾頁,所以你可以通過簡單的正則表達式解析和它取決於你,從那裏如何操縱保存的頁面
使用硒的webdriver和Python用,你只需訪問.page_source
屬性來獲取當前頁面的源代碼。
例如,使用Firefox()
司機:
from selenium import webdriver
driver = webdriver.Firefox()
driver.get('http://www.example.com/')
print(driver.page_source)
driver.quit()
- 1. Python:在後臺運行腳本並執行輸入/輸出
- 2. 如何在qmake之後運行腳本?
- 3. 如何遠程運行python腳本並輸出輸出
- 4. 從正在運行的python腳本讀取輸出的Linux python
- 5. 從python腳本獲取輸出到django
- 6. 如何在頁面內容顯示之前運行greasemonkey腳本?
- 7. 獲取Python腳本在舊版本上運行時出錯
- 8. 如何從網頁運行python腳本?
- 9. 繼續運行/執行selenium java腳本之後Windows崩潰(BlueScreen)
- 10. 如何在後臺運行shell腳本並得不到輸出
- 11. Python 3在windows中運行腳本時獲取輸入
- 12. 如何在python腳本中獲取exe的輸出?
- 13. 獲取python腳本的輸出從Python腳本中
- 14. 如何在Selenium IDE中運行嵌入在頁面中的腳本?
- 15. 從Python CGI腳本運行Selenium webdriver
- 16. 如何在當前窗口會話中運行selenium python腳本?
- 17. 如何從R腳本獲取輸出
- 18. 獲取python腳本的運行時間
- 19. 如何在頁面由JQuery更改後在selenium2 python中獲取頁面源碼
- 20. Python with Selenium:分頁問題
- 21. 在jsp頁面上輸出perl腳本
- 22. 如何在註銷SSH後在後臺運行Python腳本?
- 23. 如何在運行後在後臺啓動python腳本?
- 24. 在Django之外運行Python腳本
- 25. 如何在Selenium RC中運行Selenium IDE腳本?
- 26. 如何在頁面出錯時獲取頁面的URL或運行函數?
- 27. 如何在運行時在Selenium IDE中獲取文本框ID
- 28. 從在Python Python腳本獲取輸出測試
- 29. 動態網頁從後臺運行的python腳本獲取數據
- 30. 在.net頁面中運行PHP腳本
後一些更多的搜索我開始拼湊的方式來做到這一點使用Firefox的配置文件,你必須創建一個Firefox配置文件,然後有硒下啓動並且你可以使用一個firefox插件,將所有頁面自動保存到指定的目錄中,一旦完成,我將在這裏發佈一個簡短的教程供參考,因爲關於此主題的信息似乎相當稀少 – Rick 2010-08-26 00:58:37
ret = sel.get_string(「getBodyText」, []) – Rick 2010-08-26 21:01:37