幫助Java Swing HTML解析

2010-06-03 100 views 1 likes

我解析了Java Swing HTML解析庫中的HTML文檔的集合，並試圖隔離<title>標記之間的文本，以便我可以使用它們來識別文檔，但我有一個很難完成，由於handleStartTag方法沒有標籤幫助Java Swing HTML解析

來源

2010-06-03 nicotine

我對這些庫並不熟悉，但是您可以開始在那裏抓取文本，然後在處理結束標記時停下來嗎？ – 2010-06-03 19:33:09

回答

您可以使用XPath從HTML拉出數據的內部訪問文本：

String html = //... 

//read the HTML into a DOM 
StreamSource source = new StreamSource(new StringReader(html)); 
DOMResult result = new DOMResult(); 
Transformer transformer = TransformerFactory.newInstance().newTransformer(); 
transformer.transform(source, result); 
Node root = result.getNode(); 

//use XPath to get the title 
XPath xpath = XPathFactory.newInstance().newXPath(); 
String title = xpath.evaluate("/html/title", root);

然而，HTML必須很好地形成XHTML爲此工作。例如，「<br>」標記在HTML中有效，但在XHTML中無效，因爲它未關閉。它必須是「< br/>」才能在XHTML中有效。

來源

2010-06-03 19:43:19 Michael

相關問題

1. Java Swing幫助
2. hpple html解析iphone sdk幫助？
3. perl HTML解析的一些幫助
4. 串解析幫助
5. 幫助解析resources.arsc？
6. 幫助URL解析
7. C/C++/Java/C＃：幫助解析數字
8. 在java中解析sql需要幫助
9. 需要Java代碼的幫助... HTML解析器不能被解析類型
10. Javax Swing Timer幫助
11. 有關java swing/GridBagLaytout的幫助
12. 需要幫助的的Java Swing的JFrame
13. 幫助Java程序（Swing +數據庫）
14. XML jquery解析幫助
15. 位置解析幫助請
16. 幫助用DOMDocument解析XML
17. 字符串解析幫助
18. 需要幫助解析JSON
19. 需要幫助解析JSON
20. 在VB.Net解析幫助
21. PERL XPath解析器幫助
22. scala：解析器幫助
23. EditText解析爲int幫助
24. Java Quicksort幫助瞭解
25. 解析Java中的文本文件 - 需要幫助理解NullPointerException
26. HTML解析Java中
27. 用Java解析HTML
28. 解析HTML Java中
29. CodeIgniter窗體幫助文本輸入字段導致html解析
30. 幫助HTML解析並將請求發送到Web服務器