2017-08-03 32 views
0
<a href="some_url" game_id="Some integers"</a> 

「某些整數」是每個href鏈接都會改變的數字。將`tag.find_all`用於隨機數的訪問器(BeautifulSoup)

從此我想提取href「some url」。

我現在代碼:

for link in table.find_all("a",{"game_id":?}): 
    href=link.get(href) 

我應該把什麼「game_id」:問號,使代碼可以檢測HREF鏈接?

+0

你應該把''一些整數'',儘可能簡單。此外,您需要將'href = link.get(href)'更改爲'href = link.get('href')'。 –

+0

是「class」還是其他一些面向數據的屬性的href部分? –

+0

@LukaszSalitra是的,還有「season_id」,總是93783,所以「season_id」= 93783 –

回答

1

對於第一位,您需要regex來解決這個問題。

import re 
for link in table.find_all('a', {'game_id' : re.compile('\d+')}): 
    href = link.get("href") # or href = link["href"] 

此外,您可以使用雙引號訪問href字段。

+0

你陷入了與我嘗試使用OP代碼時相同的陷阱,它缺少':':) –

+1

@ViníciusAguiar我的壞!剛注意到。 TY。 –

+0

我剛編輯原文。 「一些整數」是像每個href鏈接中改變的「5267」這樣的數字。問題是我不能在game_id標記中加入任何具體的參數,因爲每個href鏈接中的整數都在變化。 –