我有一個XML輸出如下所示正則表達式來結合標籤
<B-company> The British </B-company> <I-company> Broadcasting Corporation is a </I-company> <B-Type> public </B-Type> <I-Type> service broadcaster </I-Type> <HQ> headquartered </HQ> <B-company> at </B-company> <I-company> Broadcasting </I-company> <B-Type> House </B-Type> <I-Type> in </I-Type> <HQ> London </HQ>
這裏B-tag爲開始標籤和I-標籤顯示延續標籤/結束標記(如果沒有進一步的I-標籤被找到)。
我期待這樣的事情作爲一個輸出
<company> The British Broadcasting Corporation is a </company> <Type> public service broadcaster </Type> <HQ> headquartered </HQ> <company> at Broadcasting </company> <Type> House in </Type> <HQ> London </HQ>
即字符「B-」需要從這樣的第一標籤形成和所有的標籤被刪除,直到我們有「/ I-」標記並添加到最後。我們如何在java正則表達式中實現這一點。
[使用XML解析器代替?](https://stackoverflow.com/a/1732454/2773311)關於使用正則表達式解析XML/HTML ... – Arc676
@ Arc676它很難被稱爲「解析」,如果輸出是xml。這些看起來像基本的字符串操作,只是字符串恰好是xml。 –
@Rawing,你是對的。它只是用一些標籤編碼的基本字符串。它不遵循正常的XML約定。對我來說,使用XML解析器似乎對此有點矯枉過正。因此,正則表達式的方法 – Betafish