2013-01-16 24 views
1

如何匹配鏈接中的href和'a'vlaue?匹配鏈接中的href和'a'值

所以,從下面抽出 'www.google.com' & '測試':

<A HREF="www.google.com/test.html" title="test">test</A> 

這裏就是我想:'<A HREF=(.+).html'但它不匹配?

+2

不要使用正則表達式來解析HTML。有很多用於各種語言的HTML解析器。你在使用哪一個? – pemistahl

+1

對於用戶的防禦,有時你想要的只是一個快速骯髒的正則表達式,因爲你正在處理一些事情,你知道這些標籤總是以特定的方式構造......但是給定的正則表達式並不是一個很好的開始手頭的問題。 – paddy

+2

事情永遠不會像開始時那樣容易,但是一個正確的case的正則表達式就像['\(.*\)'](http://refiddle.com/gjv)。在自己的危險使用:) –

回答

1

HTML的正則表達式可能會變得很脆弱,但是對於這種確切情況,正則表達式可能是正則表達式;

<A HREF="\(.*\)" .*>\(.*\)</A>

0

由於文本html不會出現在你的標籤.....

+0

我更新了問題,但結果相同。 –

1

試試這個:

<A.*HREF\s*=\s*(?:"|')([^"']*)(?:"|').*>(.*)<\/A> 

Group1和Group2會給你想要的結果。

+0

請注意,它只能在這個特定的標籤上工作,這顯然甚至不是一個真正的示例,因爲URL不正確。 –