2011-02-17 56 views
2

字符串從除去從字符串任何HTML刪除編碼的HTML我現在有一個擴展方法。從使用RegEx

Regex.Replace(s, @"<(.|\n)*?>", string.Empty); 

也能正常工作整體上,然而,我偶爾會得到通過串它們內部有兩個標準的HTML標記,用編碼標記沿(我沒有源數據的控制,所以不能在入境點),如正確的事情

&lt;p&gt;<p>Sample text</p>&lt;/p&gt; 

我需要,將刪除兩個編碼和非編碼的HTML(無論是段落標籤,錨標籤,格式化標籤等)從字符串的表達式。

+0

類似於@「(<| <)(。| \ n)*?(> >)」我認爲 – 2011-02-17 11:11:26

+0

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except -xhtml自包含的標籤/ 1732454#1732454 – digEmAll 2011-02-17 11:12:44

回答

5

我認爲你可以做,在兩道次與你相同的擴展方法。

首先替換通常的未編碼標籤,然後Decode返回的字符串,並再次執行。簡單