2012-02-27 86 views
0

請嘗試以下....JSoup文檔結構問題

String rq = "http://www.musicbrainz.org/ws/2/release/ac1afa8d-1a86-4435-9714-0a5e808e4c83?inc=recordings";<br></br> 
Document doc = Jsoup.connect(rq).get(); 

您可以在軌道結構如下圖所示瀏覽器中看到...

<track><br></br> 
    <position>1</position><br></br> 
    <length>249000</length><br></br> 
    <recording><br></br> 
    <title>Hello</title><br></br> 
    <length>249000</length><br></br> 
    </recording><br></br> 
</track&gt;<br></br> 

但是,如果你在看文件已被重組爲...

<track></track><br></br> 
<position>1</position><br></br> 
<length>249000</length><br></br> 
<recording><br></br> 
    <title>Hello</title><br></br> 
    <length>249000</length><br></br> 
</recording><br></br> 

任何想法是怎麼回事? (使用jsoup-1.6.1.jar)
謝謝!

+0

這不是HTML,但XML。使用XML解析器。 – 2012-02-27 21:13:19

回答

1

我相信這是因爲你解析的文檔是XML而不是HTML。 Jsoup主要是一個HTML解析器。

0

您可以使用jsoup來解析XML是這樣的:

Document doc = Jsoup.parse(xmlString, baseInput, Parser.xmlParser());