1
我需要一個解決方案來比較SecondSpider
的每個項目與FirstSpider
的所有項目。看看這個虛擬代碼。如何比較每個Scrapy蜘蛛項目與另一個Scrapy蜘蛛項目?
class FirstSpider(Spider):
all_items = []
def parse(self, response):
trs = response.xpath("table tr")
for tr in trs:
item = SomeItem()
item["one"] = "one"
yield item
class SecondSpider(Spider):
def parse(self, response):
trs = response.xpath("table tr")
for tr in trs:
item = SomeItem()
item["one"] = "one"
if item in FirstSpider.all_items:
yield item
謝謝!
寫每個單獨的文件並使用實用程序'diff'?否則,您可能需要包含小樣本輸入和基於這些輸入的所需輸出。祝你好運。 – shellter