我試圖從一塊美麗的湯HTML提取一些鏈接,並將它們追加到一個新的熊貓數據框的行。追加鏈接到熊貓df新行後使用美麗的
到目前爲止,我有這樣的代碼:
url = "http://www.reed.co.uk/jobs
datecreatedoffset=Today&isnewjobssearch=True&pagesize=100"
r = ur.urlopen(url).read()
soup = BShtml(r, "html.parser")
adcount = soup.find_all("div", class_="pages")
print(adcount)
從我的輸出,那麼我想利用每一個環節,通過HREF =標識「」,並存儲每個人在大熊貓數據幀的新行。
使用上面的代碼片段,我最終將在我的新數據集中有6行。
任何幫助,將不勝感激!
您提供的網址給出了404 –