0
我使用apache nutch在rosettacode上執行爬行。我不想抓取整個網站,我只想抓取選定的主題(例如,http://www.rosettacode.org/mw/index.php?title=Special%3ASearch&search=Optimization+algorithms&go=Go)。但我無法執行爬網,它向我發出錯誤說:「沒有網址抓取..檢查你的種子列表和URL過濾器」。任何人都可以幫我解決這個問題嗎?如何使用apache nutch在少數主題上抓取數據?
謝謝..它的工作原理 – Rasika