我試圖以編程方式從本網站中刪除所有表格數據 http://www.virginiaequestrian.com/main.cfm?action=greenpages&GPType=8。如何獲取BeautifulSoup中選定行的表格數據
理想情況下,這將逐行進行。例如,我可以說抓住每一行的所有表格數據,然後有能力跳過特定的行。
from bs4 import BeautifulSoup
import requests
r=requests.get('http://www.virginiaequestrian.com/main.cfm?action=greenpages&GPType=8')
soup=BeautifulSoup(r.content,'lxml')
data = []
info = {}
DataGrid=soup.find('table')
for tr in DataGrid.find_all('tr')[1:]:
for td in tr.find_all('td')[0]:
info['Name']=td
for td in tr.find_all('td')[1]:
info['City']=td
for td in tr.find_all('td')[2]:
td=td.strip().replace(',','')
info['Phone']=td
for td in tr.find_all('td')[3]:
info['more']=td
data.append(info)
我試過切片,雖然它似乎在TR級別上工作,一旦我做循環要求它找到所有每一行的表中的數據,我只能拿回值的整個列表。
實際上'Datagrid'是什麼? –
它應該是湯的相關選擇。 – user3590113