2016-11-23 92 views
0

我使用Lucene 5.3.1,並且我已經編制了一些文檔的索引,現在我試圖找到一個內置函數來計算所有標記計數(跨集合/ index)如何計算集合/索引中的所有標記數

我知道我可以迭代所有文檔並對其長度進行求和。但是由於我的複雜算法增加了運行時間,我試圖避免這種方法。我認爲lucene可能有一個API ...

畢竟,我GOOGLE了這個功能(或任何類似的功能),但我找不到任何有用的鏈接。

現在的問題是:是否有任何內置函數返回集合中的所有枚舉數(即整個索引)?如果沒有,是否還有其他最佳方法?

任何幫助表示讚賞,謝謝。

回答

1

最終我找到了解決方案。

我以下列方式使用CollectionStatistics

CollectionStatistics collectionStats = indexSearcher.collectionStatistics("Body"); 
long token_count = collectionStats.sumTotalTermFreq(); 

sumTotalTermFreq()方法集合中返回的所有標記。它適用於任何查詢。

相關問題