2017-06-16 71 views
0

我有一個Elasticsearch索引,其中包含大約25億個文檔,分析字段中包含大約1800萬個不同的術語。是否有可能快速獲得包含詞彙的文檔數量而不搜索索引?查找elasticsearch中包含術語的文檔數

似乎ES會在分析字段時存儲該信息,或者可能能夠計算倒排索引的長度。如果有一種方法可以搜索多個術語並獲取每個術語的文檔頻率,那會更好。我想定期進行數千次這樣的嘗試,而且我不知道是否有一種有效的方法來做到這一點。

回答

1

您可以使用Count API僅從查詢返回計數,而不是完整的文檔列表。

至於Elasticsearch是否爲您提供了一種無需查詢的方法:我相當有信心Elasticsearch沒有在索引之外存儲該信息,因爲這正是lucene索引已經做的。這就是一個倒排索引,即按照術語索引的文檔圖。 Lucene的設計主要是通過有效的術語來查找文檔。

+0

謝謝!我會和我的同事一起回顧一下。 – neelshiv

相關問題