2010-05-15 316 views
0

我試圖將富文本字符串轉換爲純文本或html。我目前使用的RichTextBox.Text功能幾乎可以在所有情況下正常工作,除非文本包含反斜槓,否則某些文本會被剝離,因爲轉換器認爲它是rtf格式的一部分。有沒有人有任何想法如何讓反斜槓停留在這種情況下。 下面是一個字符串的一個例子,我將不得不將包含反斜槓的富文本轉換爲純文本或html

{\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fnil\fcharset0 Arial;}}\viewkind4\uc1\pard\fs17 Testing Export \with comments\par} 

我需要將「測試導出\與評論」,我從RTF轉換找回的文字是「測試導出註釋」中的文本。任何幫助將不勝感激。如果您還有其他問題,請回復。

+0

你使用什麼語言?它應該轉義爲'\\\',這就是我用.net/vb6 Richedit組件看到的。 – 2010-05-15 14:11:46

回答

0

我認爲轉換器是正確的。 RTF文本中的真實反斜線應該被轉義(例如,到\\)。我相信你所得到的是,RTF根本就不是有效的。

惠斯特,你可以嘗試了做一個正則表達式將其固定於輸入取代了雙機一個不屬於valid control words一部分的任何反斜槓,這似乎很脆弱,會出問題,如果有人添加了一個序列的文本一個有效的控制字。唯一的安全方法就是修復任何產生RTF的東西,以便正確地逃避反斜槓。

+0

這就是我所害怕的。不幸的是,我無法修復創建數據的原因,因爲這是我們試圖轉換的所有舊數據。感謝您的幫助。 – Allison 2010-05-15 16:41:30