代碼的相關部分是:Python:你如何使用re忽略括號中的鏈接?
import re
reargs = '<a\s*href=[\'|"](.*?)[\'"].*?>'
link = re.search(reargs,content,flags=re.IGNORECASE)
我建立一個履帶式和網頁我與在括號環節的工作,我不想因此這將是這樣的:
富FOO FOO FOO(鏈路)FOO FOO FOO FOO 鏈路 FOO FOO FOO FOO(FOO 鏈路富)FOO FOO 鏈路 FOO FOO 鏈路 ......等等
不要使用正則表達式來解析HTML。使用(X)HTML解析器。 BeautifulSoup浮現在腦海中。 –
[用正則表達式解析HTML/XML可能會有問題。](http://stackoverflow.com/questions/1732348/1732454#1732454) –
要添加更多細節,儘管現代正則表達式可以做事就像你問的那樣,這通常不是最好的主意。一個很好的線索,你應該使用一些不同的技術,事實上,你試圖匹配平衡括號,並有嵌套項目的可能性。 – Wilduck