0
所以我使用nutch V2來索引我的網站。 但是,不會從SOLR索引中刪除不再存在的頁面(我對CMS進行索引,因此可以刪除頁面)。nutch V2(含solr)刪除文件
我試圖設置:db.update.purge.404=true
在我的nutch-default.xml
,但這似乎並沒有做任何事情。
對於Nutch的V1我可以看到,命令行參數「-deleteGone」存在,但是從文檔我只能猜測,它的V2的去除。
所以我的問題是:我如何配置nutch V2來刪除不存在的網址?