Scrapyd暫停/繼續工作

看起來像沒有合法的方式來暫停/繼續爬行Scrapyd，就像Scrapy本身一樣（scrapy爬行蜘蛛-s JOBDIR = jobdir/spider-1）。我發現的唯一的解決辦法是在這裏：Scrapyd暫停/繼續工作

https://groups.google.com/forum/#!msg/scrapyusers/2VjEBEbOo7s/MSH4GJc2B0sJ

，但我一直搞不明白的想法。

那麼可以暫停/繼續Scrapyd的工作嗎？

感謝您的時間

來源

2017-09-26 Pachvarsh

的想法是以下幾點：

當您從cmd運行蜘蛛可以粘貼額外的參數，例如：scrapy crawl myspider -s JOBDIR=crawls/somespider-1

當您在端點schedule.json使用Scrapyd你也可以粘貼一些設置。如果您正在使用scrapyd-client這將是這樣的：

s = {'JOBDIR': 'crawls/somespider-1'} 
job = api.schedule(project_name, spider_name, settings=s)

後，您可以取消作業。下一次，當你將運行同樣的工作--retrieyd恢復以前的工作

來源

2017-09-26 06:08:02 AndMar

對不起，我不明白在哪裏寫這個選項。如果我運行爬蟲：（curl http：// localhost：6800/schedule.json -d project = my-parsers -d spider = my_spider）我應該在哪裏粘貼你的代碼？ – Pachvarsh

在這種情況下，你可以這樣撥打電話：'curl localhost：6800/schedule.json -d project = my-parsers -d spider = my_spider -d settings = JOBDIR = crawls/somespider-1' – AndMar

不幸的是，不管工作。當我恢復這樣的工作：'curl localhost：6800/schedule.json -d project = my-parsers -d spider = my_spider -d settings = JOBDIR = crawls/somespider-1 jobid = 3123asds5f34141asdfesw324'新的解析從頭開始，只有一個日誌是相同的 – Pachvarsh

Scrapyd暫停/繼續工作

回答

相關問題