過濾按日期範圍在Lucene的

我知道標題可能暗示它是一個重複的，但我一直沒能找到這個問題的答案具體問題：過濾按日期範圍在Lucene的

我有一個基於日期範圍過濾搜索結果。每個文檔的日期都存儲在每個文檔中（但沒有編入索引）。當使用過濾器時，我注意到索引中的所有文檔都調用了過濾器。

這意味着隨着索引增長（當前只有約300,000個文檔），過濾器會變得越來越慢，因爲它必須遍歷每個單獨的文檔。

由於日期未編制索引，我無法使用RangeQuery。

如何將AFTER過濾器僅應用於作爲查詢結果的文檔以使其更有效？

我比較喜歡在交出結果之前這麼做，以免搞亂我的分數和收藏家。

2010-07-15 Khash

不太清楚這是否會幫助，但我也有類似的問題對你和以下的（+注）想出了：

所以，總結一下：將你的日期字段索引爲數字字段;將您的查詢構建爲數字範圍查詢;將它們轉換爲緩存的過濾器包裝並掛上它們。

我想你會看到一些壯觀超過您當前的索引使用率。

祝你好運！

p.s. 我永遠不會再猜測使用Lucene時會快或慢。我一直在兩個方向感到驚訝！

2010-07-17 14:29:18

首先，要過濾一個字段，它必須被索引。

其次，使用過濾器被認爲是限制要搜索的文檔集合的最佳方式。其中一個原因是您可以緩存篩選結果以用於其他查詢。過濾器數據結構非常高效：它是一組與過濾器匹配的文檔。

但是，如果你堅持不使用過濾器，我認爲唯一的方法是使用布爾查詢來做過濾。

2010-07-16 13:36:05

是否爲匹配過濾器的文檔（意味着您必須產生所有文檔）或爲匹配過濾器的術語設置了一些位集？如果是條款，我想緩存是可能的。 – Khash 2010-07-16 17:24:13

這是一組與過濾器匹配的文檔。當使用相同的過濾器時，它允許在相同的文檔子集上搜索另一個查詢。 – 2010-07-16 17:44:25

Pascal，是否有任何策略保持此過濾器BitSet保持最新，假設文檔發生變化並添加新文檔並刪除一些文檔？ – jottos 2010-11-26 21:29:17

回答