如何匹配鏈接中的href和'a'vlaue?匹配鏈接中的href和'a'值
所以,從下面抽出 'www.google.com' & '測試':
<A HREF="www.google.com/test.html" title="test">test</A>
這裏就是我想:'<A HREF=(.+).html'
但它不匹配?
如何匹配鏈接中的href和'a'vlaue?匹配鏈接中的href和'a'值
所以,從下面抽出 'www.google.com' & '測試':
<A HREF="www.google.com/test.html" title="test">test</A>
這裏就是我想:'<A HREF=(.+).html'
但它不匹配?
HTML的正則表達式可能會變得很脆弱,但是對於這種確切情況,正則表達式可能是正則表達式;
由於文本html
不會出現在你的標籤.....
我更新了問題,但結果相同。 –
試試這個:
<A.*HREF\s*=\s*(?:"|')([^"']*)(?:"|').*>(.*)<\/A>
Group1和Group2會給你想要的結果。
請注意,它只能在這個特定的標籤上工作,這顯然甚至不是一個真正的示例,因爲URL不正確。 –
不要使用正則表達式來解析HTML。有很多用於各種語言的HTML解析器。你在使用哪一個? – pemistahl
對於用戶的防禦,有時你想要的只是一個快速骯髒的正則表達式,因爲你正在處理一些事情,你知道這些標籤總是以特定的方式構造......但是給定的正則表達式並不是一個很好的開始手頭的問題。 – paddy
事情永遠不會像開始時那樣容易,但是一個正確的case的正則表達式就像['\(.*\)'](http://refiddle.com/gjv)。在自己的危險使用:) –