2010-07-07 146 views
0

我有一個java字符串處理SGML,這樣的事情...解析java字符串處理的SGML

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain> 

如何解析它來獲得例如說裏面<suggestion> </suggestion>文本,以便得到「鴨子」出?

javax.swing.text.html.parser.Parse會有幫助嗎?或者我只能用它解析HTML文檔?

回答

1

您顯示的字符串不是HTML,但可以由an XML parser解析。

SAX API是JDK和AFAIK大部分XML解析器實現它的一部分。

+1

它只是一個純String.Will的SAX API(javax.xml.parsers)的工作? – 2010-07-07 10:37:16

+1

@Myth,來自[Javadoc](http://java.sun.com/j2se/1.4.2/docs/api/javax/xml/parsers/SAXParser.html):「XML可以從各種輸入源,這些輸入源是InputStreams,Files,URLs和SAX InputSources「。而且似乎可以使用StringReader構造一個InputSource。 – 2010-07-07 12:05:36