我有一些問題網站刮美麗的湯一些數據,我想知道如果你們任何刮板專業人士可以給我一些指導。 這是確切的網頁,我想湊: https://coinmarketcap.com/currencies/bitcoin/historical-data/?start=20130428&end=20171013 具體來說,我想抓住歷史價格的表格並以某種方式提取信息到數據幀。但首先我需要在原始html中實際找到它。 i
當運行我的代碼,我得到這個錯誤 UnicodeEncodeError: 'ascii' codec can't encode character '\u0303' in position 71: ordinal not in range(128) 這是我的全部代碼, from urllib.request import urlopen as uReq
from urllib.request im
district_name= [[li.getText() for li in data_rows[i].findAll('li')]
for i in range(len(data_rows))]
上面的代碼給出了一個州比哈爾邦的地區名稱列表。像下面的表一樣。 [['1', 'Nalanda'],
['2', 'Patna'],
['3', 'Gaya'],
['4',
現在我試圖從網頁上刮掉所有的url。它共有5個類別,每個類別都有不同的頁面(每頁有10篇文章)。 例如: Categories Pages
Banana 5
Apple 14
Cherry 7
Melon 6
Berry 2
代碼: import requests
from bs4 import BeautifulSoup
import re
from ur