我正在使用Scrapy來刮取網站。我想刮的項目頁面如下所示:http://www.somepage.com/itempage/&page=x。其中x
是從1
到100
的任意數字。因此,我有一個SgmlLinkExractor
規則與任何類似的頁面指定的回調函數。Scrapy - 沒有列表頁面,但我知道每個項目頁面的網址
該網站沒有所有項目的列表頁面,所以我想以某種方式很好scrapy刮這些網址(從1
到100
)。這傢伙here似乎有同樣的問題,但無法弄清楚。
有沒有人有解決方案?