我有以下字符串:如何在文本前綴後查找HTML div包含特定文本?
<div> text0 </div> prefix <div> text1 <strong>text2</strong> text3 </div> text4
,想知道羯羊它包含text3
裏面的div前綴之後去:
prefix<div>...text3...</div>
,但我不知道該怎麼做助教正則表達式因爲我不能使用[^<]+
,因爲div的內部可以包含strong
標籤。
請幫
編輯:
- 的div標籤前綴後guaranted將沒有嵌套
- 語言是C#
- 文本4是很長,所以結束div後的正則表達式不能看
EDIT2:我不想使用html解析器,它可以很容易(而且速度更快)達到用正則表達式編輯。 HTML很簡單:標籤中沒有屬性;沒有嵌套的div。在我的情況下,甚至有一些錯誤的答案是可以接受的。
你不能(可靠地)使用正則表達式來處理這個問題,因爲正如你所說的正則表達式不處理非常規的語言特性,比如HTML的嵌套/等等。 **你需要使用HTML DOM分析器 - 你想要做什麼語言?** – 2010-08-06 11:48:33
你可能想要了解jquery – naugtur 2010-08-06 11:49:31
什麼語言?不同的語言支持不同的RegEx功能,它們不相同。即使RegEx是錯誤的解決方案,一個好的解決方案的建議需要知道您使用的是什麼語言。 – Oded 2010-08-06 11:51:05