我使用python 3.6和Pycharm 2016.2擔任主編爬行對標籤從HTML
我想爬「號」內的對內容:「TD」標籤,如果「TD」標籤都有一個子標籤是「checked ='chedcked'」的輸入標籤。我試過regEx,來自BeautifulSoup和其他人的find_all,但仍然有錯誤消息。
請幫忙。
這是網站地址:http://www.bobaedream.co.kr/mycar/popup/mycarChart_4.php?zone=C&cno=652691&tbl=cyber
下面是我的代碼:
from bs4 import BeautifulSoup
import urllib.request
from urllib.parse import urlparse
import re
popup_inspection = "http://www.bobaedream.co.kr/mycar/popup/mycarChart_4.php?zone=C&cno=652691&tbl=cyber"
res = urllib.request.urlopen(popup_inspection)
html = res.read()
soup_inspection = BeautifulSoup(html, 'html.parser')
insp_trs = soup_inspection.find_all('tr')
for insp_tr in insp_trs:
# print(insp_td.text)
th = insp_tr.find('th')
td = insp_tr.find('td')
if td.find('input', checked=''):
print(th, ":", td)
else: pass
請顯示錯誤信息。如果我們不知道錯誤是什麼,我們無法幫助您解決問題。 – DyZ