2017-03-22 59 views
0

所以我使用nutch V2來索引我的網站。 但是,不會從SOLR索引中刪除不再存在的頁面(我對CMS進行索引,因此可以刪除頁面)。nutch V2(含solr)刪除文件

我試圖設置:db.update.purge.404=true在我的nutch-default.xml,但這似乎並沒有做任何事情。

對於Nutch的V1我可以看到,命令行參數「-deleteGone」存在,但是從文檔我只能猜測,它的V2的去除。

所以我的問題是:我如何配置nutch V2來刪除不存在的網址?

回答

2

你必須設置db.update.purge.404=truenutch-site.xml,而不是在nutch-default.xml