2011-05-16 88 views
6

在我的Scala代碼中,我使用getInputStream方法HttpUrlConnection類從服務器獲取響應。響應是XML數據。但是,數據包含HTML實體,如&'從服務器收到的XML響應中的特殊字符

有沒有一種方法可以用它們的文本替換這些字符,以便我可以正確解析XML?

+4

實際上'amp'和''是XML中的預定義實體,所以你在解析包含它們的XML文件時不應該有問題。 – MarcoS 2011-05-16 13:31:49

+2

「正確解析XML」意味着您正在使用XML解析器。 JDK自帶的代碼將正確處理這些序列,因此您使用哪一個? – Anon 2011-05-16 13:37:07

回答

3

有必要將這些實體編碼爲xml,以免它們干擾其語法。 &lt;(<)和&gt;(>)實體使這更明顯。解析其內容散佈於<和>符號的XML是不可能的。

Scala的scala.xml包應該爲您提供解析xml所需的工具。 Here's some guidance來自圖書館的作者。