2013-05-07 116 views
0

任何人都可以請告訴我什麼是最好的網頁瀏覽器自動化框架/庫?任務是打開Web瀏覽器頁面,登錄,執行一些長時間的搜索,並將收集的信息保存爲excel。現在我在C#中使用IE引用,但在工作中我只能使用IE8。如果我已將其升級到IE9,但目標網站上的某些腳本開始處理錯誤。據我所知,我試圖使用awesomium,但我無法用它的幫助解析頁面。有沒有任何變種高速做到這一點?庫的大小 - 並不重要。網絡瀏覽器自動化(Robor)

如果有任何解決方案與Scala兼容,那就太好了。

+0

看看[selenium](http://docs.seleniumhq.org/)。它內置了對C#和Java的支持(因此也支持Scala) – 2013-05-07 10:39:28

回答

0

正如om-nom-nom已經暗示,你最好的選擇可能是像selenium webdriver這樣的webdriver實現。它有c#和java的綁定,可以使用IE,FF,Chrome,phantomjs(很棒,如果你想去無頭的話)等等。

請注意,直接使用網絡驅動器收集信息可能不是最好的辦法,尤其是在網站內容變化很快的情況下。在這種情況下,使用webdriver保存html頁面源可能很有用,然後切換到靜態內容的更高效的庫,如JSoup