我試圖從here搶玩家名稱和FP列。通常,當我需要表格信息時,我可以使用pandas
將其加載到Dataframe
中,或者至少使用bs4
運行find_all()
方法。我發現一個頁面,推薦這樣的:更簡單的方法來刮這個困難的網站?
import requests
from bs4 import BeautifulSoup
scrape_url ='http://www.numberfire.com/nba/fantasy/full-fantasy-basketball-projections'
page = requests.get(scrape_url, headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36'})
soup = BeautifulSoup(page.content, "html5lib")
script = soup.find('script', text=lambda x: x and 'NF_DATA' in x).text
data = re.search(r'NF_DATA = (.*?);', script).group(1)
data = json.loads(data)
print(data)
但沒有工作,如果任何人有一定的指導我將不勝感激。