2017-03-06 63 views
1

我有一個XML文件,其中包含一些無效字符(XML 1.0中不支持字符)。 我想分析這個文件,但是我收到了XML包含無效字符的例外。 是否有任何可能的方法來解析帶有無效字符的XML。或跳過包含無效字符的節點屬性。用無效字符解析XML

+0

請問如果在XML 1.1模式強制解析器,或改變了XML序言聲明文件爲1.1 XML(這是怎樣的一個黑客攻擊它的工作,但一個最容易測試)? – GPI

回答

0

可能的解決方法是將其作爲字符串加載並用有效的字符或標記替換無效字符,以便知道它在那裏。然後正常解析。

+0

感謝您的回覆。XML的大小太大,所以它是一個複雜的程序,我有我的行號,我得到無效的字符,所以有任何w ay修改特定行的內容。 – Shrikant

0

所以你的意思是有字符&,<,>(「或'屬性中)?下一個處理階段的有效數據:

InputStream yourFancyIllegalCharConverter = new YourFancyIllegalCharConverter(realInputStream); 
XMLInputFactory factory = XMLInputFactory.newInstance(); 
XMLStreamReader parser = factory.createXMLStreamReader(yourFancyIllegalCharConverter);