這裏有一堆HTML文本提取工具。主要用於Java或Python。我遇到的最常見的是鍋爐。這裏和那裏有幾個API,有些似乎工作得很好。有誰知道在PHP中的任何事情嗎?用於php的html文本提取
3
A
回答
0
你可以嘗試phpQuery:
0
DomDocument是在PHP中使用的一類,如果你有libxml的支持,可以解析HTML文件,讓你在它們之間迭代或發行XPath查詢來查找特定的節點DOM樹。這是理想的方法。或者,如果文本足夠簡單且均勻,則可以使用preg_match()從數據中提取文本,使用Regular Expressions。
+2
Oooh,在那裏生活危險。你可以被釘死在暗示你在這裏知道(你知道我在說什麼)。標準鏈接出現之前需要多長時間...? – DaveRandom 2012-07-07 22:36:58
+0
@DaveRandom :)是的,我知道你的意思。我試圖對這種事情保持務實,因爲有時候它可能也會起作用。 – drew010 2012-07-08 02:28:04
相關問題
- 1. preg_match,regexp,php,從html中提取文本
- 2. 文本提取PHP
- 3. 如何使用PHP從HTML文件中提取所有文本?
- 4. 從HTML中提取文本
- 5. 從html中提取文本?
- 6. C#Regrex提取HTML文本
- 7. 鑑於HTML文件提取只是有意義的文本
- 8. 使用jquery從html中提取文本
- 9. 使用python從html中提取文本
- 10. 使用Javascript從HTML中提取文本
- 11. PHP中提取文本
- 12. 使用PHP從HTML獲取文本
- 13. 從PHP中提取HTML中的所有文本和img標籤。
- 14. 從html文件中提取文本
- 15. 從html文件中提取文本python
- 16. 的Html庫中提取文本
- 17. PHP HTML DOM提取標籤的文本,而不包括嵌套標籤文本
- 18. 如何從PHP文件中提取HTML?
- 19. 用PHP提取腳本的html註釋上的負面lookbehind
- 20. 用於提取HTML郵件的AppleScript
- 21. PHP DOMNode:如何提取不僅文本,而且HTML標籤也
- 22. 提取HTML文本內容,以PHP數組
- 23. PHP從html頁面提取所有文本
- 24. 從字符串的PHP文本提取
- 25. 如何從html頁面提取文本?
- 26. HTML下載和文本提取
- 27. 從HTML(Perl)中提取文本
- 28. 如何提取HTML表格文本
- 29. 從Python解析HTML中提取文本
- 30. xcode - 從html代碼中提取文本
定義「html文本提取」。你在找[DOM](http://php.net/manual/en/book.dom.php)嗎? – DaveRandom 2012-07-07 22:35:10
不,就像你在iOS上所瞭解的那樣,他們有「讀者」,它會將網站上的所有垃圾(比如增加,導航等)拿出來,只是顯示內容以便閱讀?這就是我的意思 – Bill 2012-07-08 19:00:08