2010-09-14 73 views

回答

2

如果未存儲的字段已存儲…他們會被稱爲存儲的領域,對吧?

對於未存儲的字段,所有您可以看到的都是標記化的關鍵字,因爲它們被編入索引,並且需要對倒排索引進行非反轉。使用IndexReader API,可以枚舉特定字段中的所有獨特術語。然後,對於每個術語,您可以枚舉包含該術語的文檔。這粗略地告訴你給定文檔的指定字段的值。

根據在索引期間在字段上執行的分析,這可能允許您精確重建原始字段,或僅給出您可能包含的內容的粗略概念。

+0

這似乎是正確的。我讀過Luke的源代碼,他們完全像這樣。希望有更快的東西...無論如何,謝謝! – 2010-09-14 22:15:00