我想從正則表達式的html代碼中獲取一個url。我不太瞭解正則表達式,所以我有點困惑,因爲它不起作用。這種情況:關於正則表達式case
<a href="cotizacion-valor/abengoa/" style="text-decoration:none;color:#006699;">ABG.MC</a>
而我試圖讓 「阿文戈亞」 使用此正則表達式:
".*cotizacion-valor\/(/w+)\/.*"
另外,我使用python,因此代碼:
regex_companies = ".*cotizacion-valor\/(/w+)\/.*"
match_companies = re.findall(regex_companies, content_web)
我的正則表達式有什麼不好?由於
編輯:還有一個問題:
我能做些什麼來只得到第一場比賽?因爲這個href沿着具有相同內容的文檔重複(但也與不同的,所以我必須搜索全部)。