我在網站上做過網頁抓取。它只在頁面中取得前20個元素。如果我們向下滾動,其餘元素將被加載。如何刮這些元素呢?有沒有什麼不同的方法來做到這一點?BeautifulSoup僅識別頁面中的幾個元素
import requests
from bs4 import BeautifulSoup
r=requests.get("https://www.century21.com/real-estate/rock-spring-ga/LCGAROCKSPRING/")
c=r.content
c
soup=BeautifulSoup(c,"html5lib")
soup
all=soup.find_all("div",{"class":"property-card-primary-info"})
len(all)
它只給出20個。不是全部。如何刮掉隱藏的元素呢?
元素似乎滾動動作之後被加載,則可能需要另一種工具來提取它們。 – PRMoureu
什麼樣的工具? –
selenium可以工作,https://stackoverflow.com/questions/14583560/selenium-retrieve-data-that-loads-while-scrolling-down – PRMoureu