2010-09-27 76 views
0

我需要找到一個TR內部的任何內部什麼...幫助與正則表達式:標籤

<tr class="class1"> 
    more tags here, 
    multiple lines... 
</tr> 

我怎樣才能得到任何東西,<tr class="class1"></tr>之間的?

謝謝!

+0

正則表達式不適合解析HTML,因爲HTML不是[常規語言](http://en.wikipedia.org/wiki/Regular_language)。請考慮DOM解析器。 – 2010-09-27 04:04:24

+0

可能的重複[什麼正則表達式匹配文本不包括HTML標籤內的內容?](http://stackoverflow.com/questions/179779/what-regex-will-match-text-excluding-what-lies-within-html -tags) – 2010-09-27 04:09:08

回答

1

You need to use a real HTML parser,正則表達式不足以執行此任務。

這就是說,你可以使用這樣一個不好的表達式:/<tr.*?>(.*?)<\/tr>/其中組1將具有(通常)<tr>標籤之間的內容,但是不能保證正確性......像嵌套標籤這樣的東西會拋棄它。 您需要使用真正的HTML解析器

+0

我只需要得到trs之間的內容......如果它的格式正確與否,以及它的內部是什麼 – 2010-09-27 04:06:49

+2

如果格式良好或沒有格式化,這一點很重要,因爲如果您要創建一個正則表達式,你必須考慮到這一點。也可能有無限嵌套的'',並且正則表達式不是遞歸的。 HTML解析器是要走的路。 – 2010-09-27 04:08:03

+0

謝謝,但沒有匹配...我使用.net,應設置任何特殊設置? – 2010-09-27 04:14:56