我對HTML並不擅長,所以我對此有點失望。無法找到html標籤進行刮取
我想抓取instagram datetime帖子使用python,並意識到日期時間信息不是沒有該文章的HTML文檔。但是,我可以使用檢查元素來查詢它。見下面的屏幕截圖。
如果正好位於這個日期信息,以及如何獲得呢?
我從這個隨機文章「https://www.instagram.com/p/BEtMWWbjoPh/」取的例子。元素位於頁面中顯示的「12h」處。
[Update]我正在使用urllib抓取url,並在python中用bs4進行刮擦。輸出沒有返回任何與日期時間。代碼如下。我還打印出整個html,我很驚訝它不包含datetime。
html = urllib.urlopen(url).read()
soup = BeautifulSoup(html, 'html.parser')
tags = soup.select('time')
for tag in tags:
dateT = tag.get('datetime').getText()
print dateT
什麼蟒蛇您使用的是刮的頁面庫? – BananaNeil
已更新我的帖子。謝謝 – Jake