Scrapy是一個網絡爬蟲,我創建了一個蜘蛛。 我想要蜘蛛創建2個鏈接的正文2個HTML文件。 創建的html文件是空的。 import scrapy
from scrapy.selector import Selector
from scrapy.http import HtmlResponse
class DmozSpider(scrapy.Spider):
如果我有一個字符串: 「快速的棕色狐狸跳過了懶狗! 我會經常使用split()函數來標記字符串。 testString = "The quick brown fox jumps over the lazy dog!"
testTokens = testString.split(" ")
這會給我一個清單: ['The', 'quick', 'brown', 'fox', 'jumps', '