我有要求從滾動的HTML源代碼中提取元屬性。滾動HTML代碼後包含如下正則表達式來選擇HTML中的部分
例子:
<meta property="og:site_name" content="asasasas">
<meta property="og:title" content="asajhskajhsaksp;" />
<meta property="og:image" content="images.cxs.com/2014/09/modit1.gif?w=209" />
在這裏,我想的只有在元property="og:image"
即結果應該是內容僅供
images.cxs.com /2014/09/modit1.gif?w=209
[不要用正則表達式解析HTML](http://stackoverflow.com/a/1732454/418066) – Biffen 2014-10-07 06:22:31
@Biffen:使用正則表達式來處理這類任務有什麼問題?沒有遞歸或正則表達式無法處理的任何東西。 – 2014-10-07 06:49:23
@ Rawing-HTML不是一種常規語言,它不能用正則表達式可靠地解析,儘管您可能使用正則表達式來標記HTML解析器中的輸入。 – RobG 2014-10-07 06:52:07