我正在搜索這個鏈接,但我沒有成功,我沒有犯任何錯誤,我的價值觀變得空白。如何用Splash刮刮JS頁面?
我正在使用python scrapy和splash。怎麼了 ?有人幫助我嗎?
這是我的蜘蛛代碼:
# -*- coding: utf-8 -*-
import scrapy
from scrapy_splash import SplashRequest
from boom.items import BoomItem
from scrapy.selector import HtmlXPathSelector
class OrumcekSpider(scrapy.Spider):
name = 'orumcek'
start_urls = ['example.com']
def start_requests(self):
for url in self.start_urls:
yield SplashRequest(url=url, callback=self.parse, endpoint='render.html')
def parse(self, response):
item = BoomItem()
item["BrandName"] = response.xpath("//*[@id='data-item']/div/a/span/text()").extract()
item["BrandSector"] = response.xpath("//*[@id='data-item']/div[3]/span/text()").extract()
return item
謝謝你的回答,我會嘗試你說的方法。 –
@EmreAydınsoy當你使用飛濺或硒進行渲染時,你應該延遲因爲渲染需要時間 – parik
我在scrapy或splash文件中沒有看到類似的東西,謝謝。 –