我有一個很大的文本文件,XML的有效證件的序列看起來是這樣的:如何在一個文檔中解析多個連續的xml文件?
<DOC>
<TEXT> ... </TEXT>
...
</DOC>
<DOC>
<TEXT> ... </TEXT>
...
</DOC>
等沒有<?xml version="1.0">
,該<DOC></DOC>
界定每個單獨的XML。在Java中解析這個問題的最佳方式是什麼?在<DOC>
中獲取<TEXT>
下的值?
如果我將整個事情傳遞給一個DocumentBuilder,我會收到一個錯誤,指出文檔格式不正確。有沒有比簡單遍歷更好的解決方案,建立一個字符串爲每個<DOC>
?
謝謝你的提示。該鏈接中的網站不再存在。 'TagSoup'變成了其他的鏈接,但很難說出什麼是經典。 – smci 2017-10-13 18:11:32