2016-03-02 74 views
1

我使用solr來索引70K左右的文件,我還沒有發送任何刪除策略,但即使如此,solr在完成70K文件的完整索引之前刪除了很少的文件,所以想要了解這怎麼可能,solr決定在整個索引完成之前刪除文檔的依據是什麼。如何solr刪除文件

在此先感謝

回答

0

的刪除是可能重複的ID,也就是說,你看到的是較早索引的文檔的更新。更新是刪除+添加,因此您最終將在索引中計入一個已刪除的文檔。

您自己在Solr中沒有設置「刪除策略」,但根據您提供Solr內容的方式,框架通常有一些方法可以檢測已刪除的條目並將它們從Solr中刪除(DIH中是deletedPkQuery)。

+0

當您說更早的索引文檔時,solr將如何識別,它將使用我們在schema.xml中指定的唯一字段還是與solr內部有關的東西將自動處理。 –

+0

如果添加了兩個具有相同uniqueKey的文檔,則後者將替換第一個(自動 - 沒有什麼要做)。 – MatsLindh

+0

所以這個uniqueKey正在談論的是在模式文件中指定的那個?糾正我,如果我錯了。 –