0
獲得下一個標籤我的HTML從Python2.7使用BS4
<CENTER><b>U.S. Patent Documents</b></CENTER>
<TABLE width="100%">
<TR>
<TH scope="col" width="33%"></TH>
<TH scope="col" width="33%"></TH>
<TH scope="col" width="34%"></TH>
</TR>
<TR>
<TD align="left"><a href="http://appft.uspto.gov/netacgi/nph-Parser?TERM1=20130322542&Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.html&r=0&f=S&l=50" target="_blank">2013/0322542</a></TD>
<TD align=left>December 2013</TD>
<TD align=left>Senzaki et al</TD>
</TR>
<TR>
<TD align=left><a href="http://appft.uspto.gov/netacgi/nph-Parser?TERM1=20130336397&Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.html&r=0&f=S&l=50" target="_blank">2013/0336397</a></TD>
<TD align=left>December 2013</TD>
<TD align=left>Senzaki et al.</TD>
</TR>
</TABLE>
我的問題是,我想提取表中的一部分,如果我們的「美國專利文獻」存在於html中,如圖所示(鏈接1)。
但是標題(「美國專利文獻」)和表體之間不共享相同的頂部標籤,所以我不能使用像
tb_body = soup.find('center').find('table')
那麼,有什麼辦法可以幫我做?
非常感謝!
它的作品!再次感謝。 :) –