從html源文件中,我必須使用java標識具有內聯樣式屬性的標記。正則表達式來標識HTML標記中的內聯樣式屬性
例如
<span id="abc"
style="font-size:11.0pt;font-family:'arial black','sans-serif'; color:#5f497a">
請幫
從html源文件中,我必須使用java標識具有內聯樣式屬性的標記。正則表達式來標識HTML標記中的內聯樣式屬性
例如
<span id="abc"
style="font-size:11.0pt;font-family:'arial black','sans-serif'; color:#5f497a">
請幫
使用正則表達式是一個辦法做到這一點,例如。或者,如果HTML格式正確,則使用解析器加載它,然後使用XPath。
//span[@style]
不僅對於span標籤樣式屬性可能存在於任何塊元素 – Roshan 2010-08-17 08:39:20
http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html
不要用正則表達式解析HTML。使用合適的HTML解析器(Java中有很多),並從DOM樹中提取所需的數據。
不要使用RegEx來解析HTML。強制性鏈接:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – Oded 2010-08-17 08:34:18