我試圖解析XML文件,但遇到錯誤消息「2字節的UTF-8序列的無效字節2。是否有人知道是什麼導致了這個問題?謝謝。2字節UTF-8序列的無效字節2
回答
要麼解析器設置爲UTF-8,即使文件被其他編碼或文件被聲明爲使用UTF-8,但它確實沒有。
最常見的是由於(Latin-x,與Latin-1類似),但解析器認爲它獲得了UTF-8
。拉丁文-1字符的某些序列(帶有重音或變音符號的兩個連續字符)形成的東西無效,如UTF-8
,特別是基於第一個b yte,第二個字節有意想不到的高位。當某些處理使用Latin-1的轉儲出XML
這可容易地發生,但無論哪種忘記輸出XML
聲明(在這種情況下XML
解析器必須默認爲UTF-8
,按照XML
規格),或權利要求它的UTF-8
甚至當它不是。
關於如何解決這個問題的任何建議?在使用第三方庫XMLTask定義一個ant任務時遇到了這個問題。 – AgentKnopf 2012-03-27 15:55:23
那很困難;否則通常要做的是爲特定編碼顯式創建一個InputStreamReader,然後將其提供給XML解析器。但不知道如何處理Ant ......除了修復XML文件本身,如果可能的話。 – StaxMan 2012-03-27 17:52:58
我想出了這個問題 - 在我的一個xml中,我有一個變音(ä,ö,ü),當我將xml文件轉換爲不同格式時,它會以某種方式搞砸了。一旦我刪除了變音符,它就解決了。 – AgentKnopf 2012-03-27 18:10:59
您可以嘗試將String.getBytes()使用的默認字符編碼更改爲utf-8。使用VM選項-Dfile.encoding = utf-8。
我有同樣的問題。我的問題是我創建了一個新的XML文件與jdom和FileWriter(xmlFile)。 FileWriter無法創建UTF-8文件。 而是使用FileOutputStream(xmlFile)解決了它。
對於那些仍然有這樣的錯誤。
因爲UTF-8被用來檢查你的XML文檔的任何拉丁字母左右: 我有同樣的問題,究其原因,我有這個:
<n:name>Åke Jógvan Øyvind</n:name>
希望這有助於
當我試圖將我的.xml文件導入到我的java工具中時,我也遇到了同樣的問題。我找到了一個很好的解決方案: 1.用Notepad ++打開.xml文件,然後將.xml文件保存爲.rtf文件。然後在寫字板應用程序中打開此文件。 2.將.rtf文件保存爲.txt文件,然後用記事本打開它,並將其另存爲.xml文件。在記事本中保存時,在彈出窗口的末尾附近,確保選擇「編碼:UTF-8」選項。 它爲我的工作,希望它也對你有用。
- 1. MalformedByteSequenceException:2字節的UTF-8序列無效的字節2
- 2. JSF 2異常:com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException:3字節UTF-8序列的無效字節2
- 3. 無效字節2 4字節文檔解析
- 4. PostgreSQL的:「無效的字節序列編碼‘UTF8’:只對錯誤
- 5. Postgresql PHP無效的字節序列編碼UTF8
- 6. PostgreSQL - Psycopg2 - copy_from - 用於編碼「UTF8」的無效字節序列:0x00
- 7. 具有特殊字符的Facelets頁面導致MalformedByteSequenceException:UTF8Reader.invalidByte中的3字節UTF-8序列的無效字節2
- 8. 的PyUnit:無法讀取XML-RPC請求:無效字節2 3字節的UTF-8序列
- 9. 「1字節UTF-8序列的無效字節1」錯誤
- 10. getResponseBodyAsStream返回 「1字節UTF-8序列的無效字節1」
- 11. 1字節UTF-8序列的無效字節1
- 12. 無效字節1個字節的UTF-8序列錯誤
- 13. 引起:com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException:1字節UTF-8序列的無效字節1
- 14. 多字節的UTF8字符
- 15. Postgres列加密錯誤 - 用於編碼「UTF8」的無效字節序列:0xa3
- 16. Rails 3中,Heroku的 - PGError:錯誤:編碼 「UTF8」 無效的字節序列:
- 17. 的PostgreSQL 9.5錯誤:編碼「UTF8」無效的字節序列:0xc3 0xee
- 18. 修改的2個字節
- 19. 如何在參數化SQL查詢中避免無效的UTF8字節序列?
- 20. 錯誤:在pgadmin中插入用於編碼「UTF8」的無效字節序列
- 21. 「在EDB加載器中編碼爲」UTF8「:0x00」的無效字節序列
- 22. Java無符號字節[2]爲int?
- 23. JAXB錯誤的說明:1字節UTF-8序列的字節1無效
- 24. PicketLink:'錯誤:無效字節序列編碼「UTF8」:設置密碼時爲0x00'
- 25. Java中的字符是1個字節還是2個字節?
- 26. BitConverter.ToInt32轉換2個字節
- 27. 變化串2字節
- 28. freading 2字節長整型
- 29. 合併2個字節
- 30. 2字節表示2008年
你如何解析XML文件? – jtahlborn 2011-05-04 02:14:48