Why do inner text is not active Here is HTML code [這裏是HTML代碼] <ul class="product">
<li class="product col-md-4 col-sm-4 col-xs-6 "><div class="product-header">
<a href="/so-mi-octopus-xanh-soc-trang
我想要獲取的網址數量在SitemapSpider之間。我試圖覆蓋start_requests方法,但它打印0.我有一個sitemap_url其中包含數千個網址。我想得到這些網址的數量。 這是我嘗試過的,但我想從站點地圖的Url不在start_urls。 class MainSpider(SitemapSpider):
name = 'main_spider'
allowed_d
我是Scrapy的新手,目前我正在嘗試編寫一個CrawlSpider來抓取Tor darknet上的論壇。目前我CrawlSpider代碼: import scrapy
from scrapy.spiders import CrawlSpider, Rule
from scrapy.linkextractors import LinkExtractor
class HiddenAnswer