我有一個xml文件,其中包含En Dash和Em Dash字符作爲元素文本的一部分。他們正在轉換爲UTF-8編碼如下。使用JavaScript在xml中使用JavaScript讀取UTF-8十六進制代碼
<TextValue>This is an En Dash: \xE2\x80\x93 This is an Em Dash: \xE2\x80\x94.</TextValue>
我想使用JavaScript來解決這些UTF-8十六進制代碼,並與任何自由文本我要取代它們。
任何人都可以建議做到這一點?我試圖使用正則表達式,但無法解析這些代碼。儘管我可以使用RegEx解決任何其他文本。
謝謝。
您是否控制了XML?因爲我不認爲'\ xE2'符號是一個很好的XML事物。這些字符(如果不是原始字節)的正確XML編碼分別是'&#x2013;'和'&#x2014;'。但是如果你被這個XML困住了,我想你會需要一些定製的解析/解碼。 – Sodved 2012-08-17 05:06:15
我不能控制那個xml。我正在從上游系統接收它。所以我需要接受它並操縱我自己。 – 2012-08-17 05:07:31
也許你的編輯器搞砸了,一切都很好? – nalply 2012-08-17 05:10:43