我想使用scrapy來抓取網頁。有沒有辦法從終端本身傳遞起始URL?如何爲scrapy提供抓取網址?
它在documentation給出了蜘蛛或URL的任何名字可以給,但是當我給出的網址,它拋出一個錯誤:
我的蜘蛛//名稱爲例子,但我我給的網址,而不是我的蜘蛛名(它工作正常,如果我給蜘蛛的名字)。
scrapy crawl example.com
錯誤:
File "/usr/local/lib/python2.7/dist-packages/Scrapy-0.14.1-py2.7.egg/scrapy/spidermanager.py", line 43, in create raise KeyError("Spider not found: %s" % spider_name) KeyError: 'Spider not found: example.com'
我怎樣才能讓scrapy使用我的蜘蛛在終端給出的網址?
example.com是否被添加到您的蜘蛛allowed_domains? – 2012-03-13 10:12:41
yes example.com已添加到allowed_domains。我真正想要的是從命令行給start_url。我該怎麼做? – 2012-03-13 10:38:10