1
我想用java和nutch 1.3 api編寫程序來抓取網站 我搜索了網頁,但沒有示例代碼 我該怎麼做? 謝謝如何編寫一個java代碼來抓取apache nutch 1.3 api的站點?
我想用java和nutch 1.3 api編寫程序來抓取網站 我搜索了網頁,但沒有示例代碼 我該怎麼做? 謝謝如何編寫一個java代碼來抓取apache nutch 1.3 api的站點?
那麼你不需要編寫任何Java代碼...只需安裝Nutch,然後離開你。但是你應該安裝Nutch 1.2,它是獨立的。
使用Nutch1.3,您需要自己安裝hadoop,並且您還需要爲webseach安裝&用戶Solr。
我已經用solrj api編寫了一個java程序來索引我的文件localy,並對其進行了控制和調試,但是我不知道它是否可以用於nutch? – hadi
nutch基於hadoop索引的URLs不是文件系統 – millebii