跳到下一個我喜歡寫BFO寬履帶,其執行以下操作:Scrapy:停止爬行一個域,如果條件滿足
- 開始第一URL
- 試圖找到鏈接到Impressum
RegEx: '.*mpressum.*'
(翻譯:印記) - 檢查是否符合某些條件。在我的情況下,如果郵政編碼在一定範圍內
- 如果滿足條件繼續爬行頁面
- 如果不符合條件,請停止對該域進行爬網以將其從未來爬網列入黑名單。
- 與未來域繼續
我怎樣才能實現Scrapy這種行爲?
基本上我這樣做是因爲我想回答以下問題:
德國的哪些域名在某個郵政編碼範圍內?
我的代碼很混亂,因爲我現在正在學習Scrapy。
我固定格式錯誤和擴展的問題。 – zx485
即使你的代碼是一團糟 - 通過編輯分享給我們的問題將是有益的。 – zx485