2010-11-09 100 views
0

我正在開發一個android項目。我正在使用dom解析器來解析xml文件。問題是我的XML文件中包含的html號碼,如&#189(分號會在每一個字符代碼結束)在dom解析器中解析html數字,如「&#189」 - android

例如

<quote>We &#8220;love&#8221; our nation</quote> 

這不過是

<quot>We "love" our nation</quote> 

我無法在dom解析中解析這個html數字,當我嘗試獲取節點值時,我得到空值。

任何人都可以告訴我如何解析這個html字符代碼?

如何這個網站字符代碼轉換爲我的XML進料將是文本字符代碼或Unicode字符?

回答

0

我已經使用xmlpullparser。它的工作現在很好。 :)

1

有一個非常類似的問題在這裏:Android decoding html in xml file

看來HTML字符打破DOM解析器,所以無法從XML實體的字符串。

有一個HTML功能將字符串中的解析HTML:

TextView tv = (TextView) findViewById(R.id.tv); 
String s = <quote>We &#8220;love&#8221; our nation</quote>"; 
tv.setText(Html.fromHtml(s)); 

輸出:

我們 「愛」 我們國家

但是它似乎是DOM ISN」噸得到的字符串轉換,所以下面的文章可能有用:Using XPATH and HTML Cleaner to parse HTML/XML

+0

嗨感謝您的答覆。你給的鏈接很有用。 – Padma 2010-11-09 14:13:36