我發現HTML Agility Pack有用和易於使用的屏幕抓取網站。什麼是在Java,Ruby,Python中用於HTML屏幕抓取的等效庫?用於Java,Ruby,Python的HTML Agility Pack或HTML Screen Scraping庫?
2
A
回答
5
找到了我一直在尋找: Options for HTML scraping?
3
BeautifulSoup是標準的Python屏幕抓取工具。
但是,最近我使用了(目前不完整)pyQuery,這或多或少是將jQuery重寫爲python,並發現它非常有用。
相關問題
- 1. Html Agility Pack Xpath
- 2. Screen Scraping
- 3. Html Agility Pack xpath IEnumerable
- 4. Html Agility Pack xPath問題
- 5. Html Agility PacK vs Sharp Query?
- 6. Html Agility Pack空值從表
- 7. Html Agility Pack DocumentNode.SelectNodes返回null
- 8. Html Agility Pack對於Nodecollection返回Null
- 9. HTML Agility Pack HtmlDocument顯示全部Html?
- 10. 使用Html Agility Pack抓取H3的InnerText
- 11. 我可以使用Html Agility Pack嗎?
- 12. 無法使用Html Agility Pack獲得XPATH
- 13. Html Agility Pack結束 - 不起作用
- 14. 使用Html Agility Pack提取表格
- 15. HTML Agility pack創建新的HTMLNode
- 16. 使用Html Agility Pack查找並移除指定的HTML標記
- 17. 使用Html Agility Pack獲取html頁面上的所有divs id
- 18. Html Agility Pack:查找註釋節點
- 19. Html Agility Pack - 循環遍歷行和列
- 20. HTML Agility Pack - 獲取頁面摘要
- 21. Html Agility Pack鏈接和img src提取
- 22. Html Agility Pack - 從html文檔中獲取html片段
- 23. screen scraping javascript
- 24. 如何使用Html Agility Pack獲取img/src或a/hrefs?
- 25. 如何使用HTML Agility Pack編輯HTML片段
- 26. 如何使用HTML Agility Pack動態解析HTML代碼?
- 27. 使用HTML Agility Pack替換HTML div InnerText標記
- 28. 如何使用Html Agility Pack加載文本爲html
- 29. 通過HTML Agility Pack將文字樣式添加到HTML
- 30. C#:使用HTML Agility Pack和XPath選擇節點的文本
LXML也不錯。 – 2009-06-30 04:40:45