我目前正在試圖讓一個程序,給一個單詞將查找其定義並返回它。儘管我已經完成了這項工作,但我不得不求助於使用RegEx來搜索存儲定義的標籤之間的文本。什麼是更有效的方式來使用Python 3.x做到這一點?Python的HTML解析
0
A
回答
5
lxml適用於Python 3.它具有兼容ElementTree的API,但在後臺使用c庫,所以速度很快,並且支持Xpaths,這是一種很好的解析方式(有時)。
4
嘗試BeautifulSoup一個很好的用於Python的HTML解析器。 (也適用於Python 3.x,儘管除非深入Python 3.0項目,請考慮使用2.7)
2
當談到HTML解析時,您的要求相當簡單。 Python標準庫包含ElementTree模塊,它應該有助於完成您計劃執行的任務。查找該頁面中給出的示例代碼片段。
另外,從來沒有犯的錯誤解析HTML/XML使用正則表達式。你可能不知道什麼時候它會變得非常複雜,在任何情況下也是一個壞主意。
相關問題
- 1. Python html解析
- 2. Python:解析wordpress HTML
- 3. 解析HTML與Python
- 4. html解析器python
- 5. 的Python - BeautifulSoup - HTML解析
- 6. Python的 - 解析HTML類
- 7. Python:用BeautifulSoup解析HTML
- 8. 用Python解析html標記
- 9. Python和BeautifulSoup解析HTML
- 10. Python - 整理HTML解析
- 11. Python,解析html表格
- 12. 使用Python解析HTML
- 13. 用python和bs解析HTML
- 14. 在Python中的jQuery的HTML解析?
- 15. 使用beautifulsoup解析python中的html
- 16. 與python的win32com和解析html問題
- 17. 一個快速的Python HTML解析器
- 18. Python 3中的HTML解析器
- 19. 的Python/BeautifulSoup解析HTML餾分
- 20. 最佳Python模塊的HTML解析
- 21. BeautifulSoup(Python)和解析HTML表格
- 22. 使用R或python解析HTML屬性
- 23. Python 3 - HTML解析器 - 空屬性
- 24. 解析Python文本並保存爲html
- 25. Python原始字符串和html解析
- 26. 從桌面解析HTML與Python
- 27. 在Python和XML解析HTML頁面
- 28. 未找到python html解析器數據
- 29. 在Python中使用BeautifulSoup解析HTML
- 30. 在Python中使用lxml解析HTML,xpath
請先嚐試搜索。 http://stackoverflow.com/search?q=%5Bpython%5D+html+parse所有這些問題都適用於您的問題。 – 2011-02-04 11:13:00
[如何獲取Python中Html頁面的內容]的可能重複(http://stackoverflow.com/questions/2416823/how-to-get-the-content-of-a-html-page-in-蟒蛇) – 2011-02-04 11:14:22