2013-03-16 99 views
2

我需要在遠程Linux主機(Webfaction)上運行Selenium(或其他可以處理javascript的webscraping工具)。我正在使用Python。共享gui-less主機上的硒

這可能嗎?服務器很少,所以我無法運行瀏覽器。或者我可以,如果我使用PyVirtualDisplay?

如何使用HtmlUnit運行Selenium?

我已經嘗試使用Selenium與硒/ PyVirtualDisplay/ChromeDriver,但不斷收到各種錯誤消息。所以我想知道在我繼續調試一些不可能的事情之前,這是否還有可能。

回答

1

如果您需要處理JavaScript Selenium/Webdriver似乎是一個很好的解決方案。

如果你需要運行無頭,GhostDriver(而不是ChromeDriver)是一個很好的選擇。它基於PhantomJS,這是一款基於Webkit的無頭瀏覽器。它有完整的JS支持。

+0

GhostDriver和Selenium一起工作,還是它自己的東西?它不在他們的列表中:http://docs.seleniumhq.org/docs/03_webdriver.jsp我嘗試過使用Selenium的HtmlUnit,但那需要Selenium驅動程序,它一直在崩潰,不知道爲什麼。 ghostdriver會要求你安裝硒驅動程序並從一個單獨的窗口運行它 - 這會很糟糕。 – user984003 2013-03-18 14:09:42

+1

它實現了Webdriver協議(即將推出的W3C標準),但獨立於Selenium項目。但是它使用了widley。 你可能想看看他們網站上的文檔,他們有自己的api,所以你可能在你的用例中沒有硒。 – hseffler 2013-03-18 20:50:38