0
A
回答
1
我通過使用Qt Webkit加載頁面幷包含JQuery來做類似的事情。
這是一個黑客攻擊,但適用於我的用例。我需要一個不需要配置的解決方案 - 只需sudo apt-get install libqt4-webkit然後您就可以開始了。
0
如果你可以通過瀏覽器支持(如使用瀏覽器來渲染和創建頁面),硒將是完美的。這將具有完全支持Ajax網站的額外好處。
如果不是,像webdriver可能會工作。
我只使用硒。
0
我使用Selenium RC + jQuery進行屏幕抓取。
示例代碼:https://github.com/tszming/Selenium-Google-Scrapper
雖然我使用PHP作爲客戶端,但你可以使用任何你喜歡的語言實現它(只要它可以跟硒RC)。
我曾嘗試過幾個CSS選擇器庫,但說實話,最好的解析器是您的瀏覽器,Selenium RC方法並不快但非常可靠。
相關問題
- 1. 通過選擇器添加CSS類
- 2. CSS模塊:通過選擇
- 3. jquery - 通過css類選擇
- 4. 通過jquery選擇器
- 5. 通過@選擇器對象
- 6. 選擇CSS選擇器
- 7. 通過Javascript動態選擇CSS URL
- 8. CSS選擇器
- 9. CSS選擇器 -
- 10. CSS屬性選擇器優先於普通的CSS類選擇器
- 11. CSS通用選擇器(*)特異性
- 12. CSS HTML選擇器與類選擇器
- 13. 通過css選擇器更改dom對象的父類
- 14. Angular 2通過css選擇器和html屬性添加值
- 15. 無法通過Selenium中的css選擇器獲取元素
- 16. Nightwatch.js通過CSS選擇器查找的問題(最新版本)
- 17. 通過類前綴的JavaScript選擇器?在CSS
- 18. 通過beautifulsoup css選擇器獲取多個標籤
- 19. 在GWT中通過CSS選擇器查找元素
- 20. 通過ID選擇器不應用CSS背景圖像樣式
- 21. CSS選擇器{N}
- 22. dijit.menu css選擇器
- 23. CSS類選擇器
- 24. Element.but選擇器CSS
- 25. CSS瀏覽器選擇器
- 26. CSS屬性選擇器vs CSS選擇器
- 27. AngularJS篩選器通過其他選擇標籤選擇
- 28. CSS選擇器選取器/取景器?
- 29. CSS選擇器只選擇第一行
- 30. JavaScript CSS選擇器,請選擇編號
我的第一個想法:最後,有人沒有問正則表達式這個問題;)當然,這已經被詳細討論了。 – NotMe 2010-11-15 22:40:31
可能重複的[HTML抓取選項?](http://stackoverflow.com/questions/2861/options-for-html-scraping) – NotMe 2010-11-15 22:40:38
我一直在使用C#刮。我已經寫了一個jQuery端口,但是我不敢在這裏發佈它,因爲害怕因爲自我推銷而被投票遺忘。 – mpen 2010-11-17 05:13:15