我想刮電子商務網站,使用ajax調用來加載其下一頁。python - 使用BeautifulSoup網站刮ajax網站
我可以抓取第1頁上的數據,但是當我將第1頁滾動到底部時,第2頁會通過ajax調用自動加載。
我的代碼:
from bs4 import BeautifulSoup as soup
from urllib.request import urlopen as ureq
my_url='http://www.shopclues.com/mobiles-smartphones.html'
page=ureq(my_url).read()
page_soup=soup(page,"html.parser")
containers=page_soup.findAll("div",{"class":"column col3"})
for container in containers:
name=container.h3.text
price=container.find("span",{'class':'p_price'}).text
print("Name : "+name.replace(","," "))
print("Price : "+price)
for i in range(2,7):
my_url="http://www.shopclues.com/ajaxCall/moreProducts?catId=1431&filters=&pageType=c&brandName=&start="+str(36*(i-1))+"&columns=4&fl_cal=1&page="+str(i)
page=ureq(my_url).read()
print(page)
page_soup=soup(page,"html.parser")
containers=page_soup.findAll("div",{"class":"column col3"})
for container in containers:
name=container.h3.text
price=container.find("span",{'class':'p_price'}).text
print("Name : "+name.replace(","," "))
print("Price : "+price)
我已經印刷由ureq讀取AJAX頁面知道我是否能夠打開AJAX頁面,我得到了一個輸出爲:
B」'是輸出: 打印(頁)
請爲我提供一個解決方案來刮取剩餘的數據。
試着用'硒'。 –
我是新來的網絡報廢它會是你的一種,如果你可以提供我的代碼 –
我建議使用他們的APi,http://developer.shopclues.com/index.php/API_Basics#link –