1
A
回答
1
您可以使用下面的代碼從字符串中僅提取HTML標記。
package com.overflow.stack;
/**
*
* @author sarath_sivan
*/
public class ExtractHtmlTags {
public static void getHtmlTags(String html) {
int beginIndex = 0;
while(beginIndex!=-1) {
beginIndex = html.indexOf("<", 0);
int endIndex = html.indexOf(">", beginIndex+1);
String htmlTag = "";
try {
if(beginIndex!=-1) {
htmlTag = html.substring(beginIndex, endIndex+1);
}
} catch(Exception e) {
e.printStackTrace();
}
System.out.println(htmlTag);
html = html.substring(endIndex+1, html.length());
}
}
public static void main(String[] args) {
String html = "<html><body><h2>List HTML tags from a String</h2>hello<br /></body></html>";
ExtractHtmlTags.getHtmlTags(html);
}
}
但是,我不明白你想要用提取的HTML標籤做什麼。祝你好運!
0
從的HtmlUnit解析器可以接受字符串並返回一個結構化的結果:
http://htmlunit.sourceforge.net/apidocs/com/gargoylesoftware/htmlunit/html/HTMLParser.html
1
您可以嘗試http://jsoup.org/ 不知道它允許獲得的標籤列表,但你可以獲取列表迭代DOM 。
0
page = Nokogiri::HTML(open('http://yoursite.com'))
page.css("*").map{|x| x.name}.flatten.uniq
相關問題
- 1. 從字符串中刪除html標記
- 2. 從字符串中刪除html標記
- 3. 從字符串呈現html標記
- 4. 從字符串獲取HTML標記
- 5. jquery從html字符串中刪除html標記
- 6. 將字符串標記爲HTML安全
- 7. 轉換HTML標記字符串
- 8. PHP爆炸字符串由HTML標記
- 9. 獲取HTML標記作爲字符串
- 10. 如何從PHP中的字符串獲取html標記?
- 11. 僅使用Javascript從HTML字符串中提取元標記
- 12. 使用jQuery從字符串中刪除HTML標記
- 13. 從字符串中刪除HTML標記的正則表達式
- 14. 從翻譯字符串中剝離HTML標記
- 15. 從HTML字符串中除去所有標記屬性
- 16. 從字符串中刪除部分html標記
- 17. 使用java從字符串中刪除html標記
- 18. 標記字符串
- 19. VBA從字符串中刪除HTML標記僅刪除第一個字符
- 20. 如何從PHP字符串中去除字符而不會干擾HTML標記
- 21. 以HTML標記形式輸出字符串內容
- 22. 從字符串中打印出HTML標籤
- 23. PHP字符串不輸出html標籤?
- 24. 分割字符串從文本和HTML標記
- 25. 如何從給定的字符串獲取外部HTML /標記?
- 26. 從字符串剝離html標記,css和js代碼
- 27. SWIFT 2.3 - 從取自JSON網址的字符串取出HTML標記
- 28. 字符串格式的HTML特定標記的Unescape字符java
- 29. 從標記字符串創建節點
- 30. 如何從標記字符串中轉義特殊字符?
看看這裏,我想你會找到你想要的一切 - > http://java-source.net/open-source/html-parsers – tartak 2012-03-05 11:59:43
你也許可以使用Jtidy,查看http:// jtidy.sourceforge.net/howto.html – Sap 2012-03-05 12:00:34
http://htmlcleaner.sourceforge.net – edze 2012-03-05 12:02:36