2017-09-06 54 views
0

我使用webdriver的硒在此刻,它完美的作品,但它不是我所期待的。我不喜歡的硒webdriver的是,它運行的瀏覽器(我知道有在後臺運行某些方面)的一個真實的會話的事實。是否有任何其他庫使用xpath進行網頁抓取?最佳Python庫爲使用XPath網頁抓取?

回答

1

這種情況的最佳框架是Scrapy。它有很多好東西,像中間件,管道,蜘蛛。你可以用它單獨或與像硒,請求,代理等.. 附加庫如果你想使用Selenium - PyVirtualDisplay將幫助你隱藏瀏覽器窗口